发布于May 2025

Z-Image AI 图像生成器

Z-Image 是来自 Tongyi-MAI 的开源 6B 图像基础模型，专为 prompt 一致性、广泛视觉覆盖范围以及 Turbo 和 Edit 等下游变体打造。您可以在此处使用它来完成 text-to-image 以及简单的 single-reference image-to-image 任务。

如何使用 Z-Image

在此处通过 Z-Image 生成，快速完成 text-to-image 和 single-reference image-to-image

先撰写 prompt，必要时添加单张参考图像，通过保持请求聚焦清晰，经过几次快速调整即可优化结果。

描述主体与视觉目标

草拟一份 prompt，涵盖您的主体、拍摄视角、光线、构图以及图像中所需的任何文字。

如需添加，请上传一张参考图像

若要锁定氛围、产品形状或布局方向，请上传一张参考图像，并辅以清晰的自然语言来引导生成结果。

生成快速变体并优化细节

生成您所需宽高比的图像，对比输出结果，并优化您的 prompt，直至构图和文字符合您的预期。

Z-Image的核心优势

作为基础图像模型的Z-Image关键优势

Z-Image是一款开源的6B基础模型，具备可靠的prompt对齐能力、多系列变体以及可行的本地部署选项

开源6B基础模型

作为该系列的核心基础模型，Z-Image允许团队研究、微调并部署上游发布版本，无需依赖封闭的仅限托管的工具

上游发布版本为Apache-2.0，可通过GitHub和Hugging Face公开获取

它是Z-Image-Turbo和Z-Image-Edit等下游系列变体的基础

当权重访问与本地部署比一键生成更为重要时，请选择此模型

Model strength

Media example pending. This block highlights the model behavior the page is describing.

Model strength

Media example pending. This block highlights the model behavior the page is describing.

清晰的Prompt与负向prompt可控性

官方文档强调了prompt依从性与负向prompt引导功能，可轻松确保prompt调整在输出结果中清晰呈现

当您指定主体、构图、风格以及应避免的内容时，模型会做出良好响应

这对海报、产品场景以及对排版敏感的prompt作品非常有帮助

当基础prompt模型保持稳定时，更便于对比不同变体的效果

一款基础模型即可覆盖多种视觉方向

作为未经过蒸馏的基础模型，Z-Image可适配写实样张、海报排版与风格化视觉效果，无需切换系列模型

它可在写实、海报风格和风格化方向之间灵活切换，无需过早锁定单一风格

它可基于同一基础prompt模型，高效探索不同的主体风格、姿势、构图和艺术方向调整

这在您尚未确定最终方向的早期创作阶段非常实用

Model strength

Media example pending. This block highlights the model behavior the page is describing.

Model strength

Media example pending. This block highlights the model behavior the page is describing.

真正的本地运行环境与ComfyUI支持

Z-Image已在diffusers、本地运行环境、ComfyUI工具和工作流包中得到广泛支持

除托管演示外，还提供真正的本地推理路径和社区工具链

您可将其与LoRA、ControlNet以及自定义工作流实验相结合

当本地部署是模型选择的考量因素之一时，这一点至关重要。

最佳使用场景

Z-Image 的理想使用场景

它擅长在本页面直接完成以prompt为导向的生成、海报排版、产品风格视觉效果以及single-reference优化

以Prompt为导向的产品和营销视觉素材

为以Prompt为导向的营销活动制作产品样张、包装样机、广告创意和落地页视觉效果，拥有更简洁的构图、材质和光影表现

海报与排版导向的创意概念

借助Z-Image制作海报、社交图文和注重排版的创意作品，此时prompt可控性与可读文本至关重要

基于参考图的图像优化

仅需一张参考图即可调整风格、构图或视觉方向，无需从零重建核心创意概念

支持自托管与工作流驱动的使用场景

若您计划后续将模型迁移至ComfyUI、本地运行环境或自定义图像工作流，请选择Z-Image

Prompt 模式与示例

结合实际案例撰写高效的Z-Image prompt

每张卡片都会展示一个prompt模式、真实的Z-Image输出以及核心撰写细节。打开示例即可查看完整的prompt、其生效原理，以及撰写类似prompt的技巧。

高端护肤产品主图

提示词公式

[产品] + [拍摄角度] + [载体/背景] + [布光] + [商业后期效果]

查看提示词细节展开

完整提示词

一款高端玻璃护肤瓶置于浅米色石质台座上，采用柔和定向影棚布光，带有细腻阴影，构图简洁专业，是高端电商主图风格，背景极简，带有真实反光效果，属于高端包装摄影作品。

为什么有效

这款prompt符合Z-Image的写实风格、布光把控能力和精致的商业视觉效果

预期输出

适用于着陆页、店铺首页横幅或商品详情页主图的简洁产品图

提示

先明确产品，再确定拍摄类型和载体布置方案
使用玻璃、石材、哑光、反光等材质词汇以减少歧义

双语音乐节海报

提示词公式

[海报主题] + [标题文字] + [文字语言] + [排版层级] + [背景风格]

查看提示词细节展开

完整提示词

现代风格双语音乐节海报，主标题“Summer Pulse 2026”醒目，副标题为较小字体的中文“城市电子音乐节”，背景为黑色，搭配霓虹橙和青色点缀，视觉层级清晰，标题块居中对齐，设计动感且易于阅读的活动海报。

为什么有效

当可读的中文或英文文字是创意的核心组成部分而非仅作为装饰时，Z-Image的效果会更出色

预期输出

注重文字呈现的海报创意，拥有更清晰的标题块和易于阅读的辅助文字

提示

当文字措辞至关重要时，请将准确的标题文案置于引号内
请分别描述文字排版层级和海报氛围

基于参考图的包装改版

提示词公式

[保留不变的元素] + [需要更改的内容] + [新的布光/风格/构图方向]

查看提示词细节展开

完整提示词

保留参考图中的瓶身形状、瓶盖结构和正面构图。将包装风格更改为现代哑光白与鼠尾草绿色调搭配，采用更柔和的影棚灯光，打造更简洁高端的护肤品牌视觉方向，以及更精致的零售展示效果。

为什么有效

这非常适合Z-Image的single-reference编辑功能，且能让需求更聚焦

预期输出

一次可控的改版，在保留产品辨识度的同时升级包装视觉方向

提示

先说明需要保留的元素，例如形状、取景范围或产品结构
请将修改需求限定在较小范围内，以便单张参考图就能清晰地指导生成效果

咖啡品牌快速社交广告创意

提示词公式

[主题] + [视觉方向] + [构图] + [色彩/光影] + [使用场景]

查看提示词细节展开

完整提示词

商业冰咖啡宣传视觉素材：带冰花飞溅的冷萃杯特写，饮品旁搭配高端咖啡包装，明亮的夏日日光，海滨氛围，充满活力的构图，清晰的产品摄影风格，高端饮品广告调性，无logo、无品牌名，包装设计简洁干净。

为什么有效

prompt 明确说明了产品布置、光影和宣传意图，同时避免使用品牌文案。

预期输出

可适配付费社交推广、季节性促销或首页英雄横幅的饮品广告创意方向。

提示

提及营销渠道或使用场景，让构图更具针对性。
描述一个强烈的动作（比如飞溅效果或特写镜头），而非多个相互冲突的动作。

何时选择Z-Image

若需要开源权重与本地部署灵活性，请选择Z-Image

若需要明确的prompt对齐方式、计划在本页面之外重复使用该模型，或优先考虑开源权重与本地运行环境，请选择Z-Image

若希望选择一款后续可继续使用的模型，请选择Z-Image

若希望立即在此处生成图像，并计划后续在ComfyUI、本地运行环境或自定义流水线中继续使用同一系列模型，请选择Z-Image。当prompt的控制能力与模型访问权限至关重要时，该选择更为合适

若希望直接获得开箱即用的托管风格，请使用其他模型

若希望获得与众不同的内置视觉风格，且不在意开源权重、本地运行环境或下游自定义功能，请尝试GPT-4o或Seedream。这些托管模型使用起来可能更为直接

社区佐证

针对Z-Image的社区洞察与案例

这些视频、X帖子和Reddit帖子分享了社区的真实视角与Z-Image相关案例。可在学习核心prompt模式后，将其作为补充参考内容。

视频示例

X 帖子

Reddit 讨论

开源生态系统

适用于Z-Image的相关开源项目

这些GitHub项目均经过审核，与Z-Image或其更广泛的产品线直接相关。可使用它们研究模型、运行本地实例或探索社区构建的工具

仓库 01

Tongyi-MAI / Z-Image

官方代码仓库

来自Tongyi-MAI的上游Z-Image代码仓库。它是6B模型系列、检查点、报告链接以及官方推理指南的主要来源

查看项目

仓库 02

Koko-boya / Comfyui-Z-Image-Utilities

ComfyUI 实用工具节点

专为Z-Image工作流打造的ComfyUI扩展插件，包含prompt增强、图像感知prompting以及集成采样节点

查看项目

仓库 03

martin-rizzo / AmazingZImageWorkflow

ComfyUI 工作流包

适用于ComfyUI中Z-Image系列的工作流包，包含预定义风格、细化步骤与升级步骤，以及适用于GGUF和Safetensors检查点的现成配置

查看项目

仓库 04

martin-rizzo / ComfyUI-ZImagePowerNodes

ComfyUI 自定义节点

一套专为Z-Image和Z-Image-Turbo打造的自定义ComfyUI节点，包含风格辅助节点、潜在空间设置工具以及优化工作流便捷性的辅助组件

查看项目

FAQs

常见问题

关于AI Omni Video及其平台

什么是 Z-Image？

Z-Image 是来自 Tongyi-MAI 的核心开源 6B 图像基础模型，作为更广泛的 Z-Image 系列的基础。它优先考虑 prompt 一致性、广泛的视觉覆盖范围以及灵活的下游微调或部署。

Z-Image 最适合用于什么？

Z-Image 擅长 prompt 主导的图像生成、海报创意、产品风格视觉效果，以及后续可迁移到 ComfyUI、本地运行环境或自托管设置的工作流。

Z-Image 在此处支持 image-to-image 吗？

当然可以。此工具支持 text-to-image 和 single-reference image-to-image 以用于 Z-Image。只需使用一张参考图像即可锁定形状、构图或核心视觉方向，用于您的生成任务。

Z-Image 在此处支持哪些宽高比？

本页面中 Z-Image 支持 1:1、4:3、3:4、16:9 和 9:16，涵盖标准正方形、竖版、横版以及适合社交平台的创意宽高比。

如何为 Z-Image 撰写更好的 prompt？

先确定您的主体，然后添加风格、构图、光线、材质和所需文字等细节。当您明确区分强制元素与灵活元素时，Z-Image 的表现最佳，这一点在海报、产品视觉效果和 single-reference 编辑中尤为突出。

我何时应该使用 Z-Image 而非 GPT-4o 或 Seedream 4？

如果您想要一款不限于托管工具使用的开源模型，尤其是当 prompt 控制力或自托管是优先考虑的因素时，请选择 Z-Image。如果您希望使用其内置风格和托管工作流而无需额外自定义，请选择 GPT-4o 或 Seedream 4。

Z-Image 与 Z-Image-Turbo 有何区别？

Z-Image 是该系列的基础核心模型。Z-Image-Turbo 是经过蒸馏的变体，针对更快、更轻量的推理进行了优化，这也是许多社区工作流和本地部署特别突出 Turbo 的原因。

我可以将 Z-Image 生成的图像用于商业用途吗？

上游 Z-Image 权重基于 Apache-2.0 发布，但生成资产的商业使用取决于您的使用场景、合规标准以及适用的平台条款。在进行生产工作时，请务必完成标准的法律和品牌审核，不要默认模型输出自动符合要求。

Z-Image 是开源的吗？可以自托管吗？

是的。Tongyi-MAI 已将 Z-Image 上游权重开源，该模型已可通过基于 diffusers 的路径、本地运行环境、ComfyUI 工具以及工作流包使用。相较于封闭式、仅支持云端托管的模型，这使得研究、部署和调整变得更加容易。

还有疑问？我们随时为您提供帮助

加入Discord

在本平台上将Z-Image与其他图像模型进行对比

若Z-Image不适合你的工作流，请查看这些相关模型页面，对比prompt对齐方式、视觉风格与核心应用场景

GPT-4o 图像生成器

若需要一款用于构思、编辑以及具备独特视觉倾向的通用托管图像模型，请尝试GPT-4o

查看模型

Flux 2 图像生成器

若希望通过另一种途径获得精致的图像生成效果，且拥有差异化的prompt响应与视觉倾向，请尝试Flux 2

查看模型

Seedream 4 图像生成器

如果您希望创作产出的风格更具格调或更有电影感，不妨将 Z-Image 与 Seedream 4 进行对比。

查看模型

Qwen 2 图像生成器

如需另一款支持基于参考图像生成且输出风格各异的 prompt 驱动型图像模型，请使用 Qwen 2。

查看模型

在此页面立即测试 Z-Image

打开生成器，以 prompt 或单张参考图像作为起始，在此使用 Z-Image 实现可控的 text-to-image 生成以及简便的 single-reference 编辑。

发布于May 2025

Z-Image AI 图像生成器

如何使用 Z-Image

在此处通过 Z-Image 生成，快速完成 text-to-image 和 single-reference image-to-image

先撰写 prompt，必要时添加单张参考图像，通过保持请求聚焦清晰，经过几次快速调整即可优化结果。

描述主体与视觉目标

草拟一份 prompt，涵盖您的主体、拍摄视角、光线、构图以及图像中所需的任何文字。

如需添加，请上传一张参考图像

若要锁定氛围、产品形状或布局方向，请上传一张参考图像，并辅以清晰的自然语言来引导生成结果。

生成快速变体并优化细节

生成您所需宽高比的图像，对比输出结果，并优化您的 prompt，直至构图和文字符合您的预期。

Z-Image的核心优势

作为基础图像模型的Z-Image关键优势

Z-Image是一款开源的6B基础模型，具备可靠的prompt对齐能力、多系列变体以及可行的本地部署选项

开源6B基础模型

作为该系列的核心基础模型，Z-Image允许团队研究、微调并部署上游发布版本，无需依赖封闭的仅限托管的工具

上游发布版本为Apache-2.0，可通过GitHub和Hugging Face公开获取

它是Z-Image-Turbo和Z-Image-Edit等下游系列变体的基础

当权重访问与本地部署比一键生成更为重要时，请选择此模型

Model strength

Media example pending. This block highlights the model behavior the page is describing.

Model strength

Media example pending. This block highlights the model behavior the page is describing.

清晰的Prompt与负向prompt可控性

官方文档强调了prompt依从性与负向prompt引导功能，可轻松确保prompt调整在输出结果中清晰呈现

当您指定主体、构图、风格以及应避免的内容时，模型会做出良好响应

这对海报、产品场景以及对排版敏感的prompt作品非常有帮助

当基础prompt模型保持稳定时，更便于对比不同变体的效果

一款基础模型即可覆盖多种视觉方向

作为未经过蒸馏的基础模型，Z-Image可适配写实样张、海报排版与风格化视觉效果，无需切换系列模型

它可在写实、海报风格和风格化方向之间灵活切换，无需过早锁定单一风格

它可基于同一基础prompt模型，高效探索不同的主体风格、姿势、构图和艺术方向调整

这在您尚未确定最终方向的早期创作阶段非常实用

Model strength

Media example pending. This block highlights the model behavior the page is describing.

Model strength

Media example pending. This block highlights the model behavior the page is describing.

真正的本地运行环境与ComfyUI支持

Z-Image已在diffusers、本地运行环境、ComfyUI工具和工作流包中得到广泛支持

除托管演示外，还提供真正的本地推理路径和社区工具链

您可将其与LoRA、ControlNet以及自定义工作流实验相结合

当本地部署是模型选择的考量因素之一时，这一点至关重要。

最佳使用场景

Z-Image 的理想使用场景

它擅长在本页面直接完成以prompt为导向的生成、海报排版、产品风格视觉效果以及single-reference优化

以Prompt为导向的产品和营销视觉素材

为以Prompt为导向的营销活动制作产品样张、包装样机、广告创意和落地页视觉效果，拥有更简洁的构图、材质和光影表现

海报与排版导向的创意概念

借助Z-Image制作海报、社交图文和注重排版的创意作品，此时prompt可控性与可读文本至关重要

基于参考图的图像优化

仅需一张参考图即可调整风格、构图或视觉方向，无需从零重建核心创意概念

支持自托管与工作流驱动的使用场景

若您计划后续将模型迁移至ComfyUI、本地运行环境或自定义图像工作流，请选择Z-Image

Prompt 模式与示例

结合实际案例撰写高效的Z-Image prompt

每张卡片都会展示一个prompt模式、真实的Z-Image输出以及核心撰写细节。打开示例即可查看完整的prompt、其生效原理，以及撰写类似prompt的技巧。

高端护肤产品主图

提示词公式

[产品] + [拍摄角度] + [载体/背景] + [布光] + [商业后期效果]

查看提示词细节展开

完整提示词

为什么有效

这款prompt符合Z-Image的写实风格、布光把控能力和精致的商业视觉效果

预期输出

适用于着陆页、店铺首页横幅或商品详情页主图的简洁产品图

提示

先明确产品，再确定拍摄类型和载体布置方案
使用玻璃、石材、哑光、反光等材质词汇以减少歧义

双语音乐节海报

提示词公式

[海报主题] + [标题文字] + [文字语言] + [排版层级] + [背景风格]

查看提示词细节展开

完整提示词

为什么有效

当可读的中文或英文文字是创意的核心组成部分而非仅作为装饰时，Z-Image的效果会更出色

预期输出

注重文字呈现的海报创意，拥有更清晰的标题块和易于阅读的辅助文字

提示

当文字措辞至关重要时，请将准确的标题文案置于引号内
请分别描述文字排版层级和海报氛围

基于参考图的包装改版

提示词公式

[保留不变的元素] + [需要更改的内容] + [新的布光/风格/构图方向]

查看提示词细节展开

完整提示词

为什么有效

这非常适合Z-Image的single-reference编辑功能，且能让需求更聚焦

预期输出

一次可控的改版，在保留产品辨识度的同时升级包装视觉方向

提示

先说明需要保留的元素，例如形状、取景范围或产品结构
请将修改需求限定在较小范围内，以便单张参考图就能清晰地指导生成效果

咖啡品牌快速社交广告创意

提示词公式

[主题] + [视觉方向] + [构图] + [色彩/光影] + [使用场景]

查看提示词细节展开

完整提示词

为什么有效

prompt 明确说明了产品布置、光影和宣传意图，同时避免使用品牌文案。

预期输出

可适配付费社交推广、季节性促销或首页英雄横幅的饮品广告创意方向。

提示

提及营销渠道或使用场景，让构图更具针对性。
描述一个强烈的动作（比如飞溅效果或特写镜头），而非多个相互冲突的动作。

何时选择Z-Image

若需要开源权重与本地部署灵活性，请选择Z-Image

若需要明确的prompt对齐方式、计划在本页面之外重复使用该模型，或优先考虑开源权重与本地运行环境，请选择Z-Image

若希望选择一款后续可继续使用的模型，请选择Z-Image

若希望直接获得开箱即用的托管风格，请使用其他模型

若希望获得与众不同的内置视觉风格，且不在意开源权重、本地运行环境或下游自定义功能，请尝试GPT-4o或Seedream。这些托管模型使用起来可能更为直接

社区佐证

针对Z-Image的社区洞察与案例

这些视频、X帖子和Reddit帖子分享了社区的真实视角与Z-Image相关案例。可在学习核心prompt模式后，将其作为补充参考内容。

视频示例

X 帖子

Reddit 讨论

开源生态系统

适用于Z-Image的相关开源项目

这些GitHub项目均经过审核，与Z-Image或其更广泛的产品线直接相关。可使用它们研究模型、运行本地实例或探索社区构建的工具

仓库 01

Tongyi-MAI / Z-Image

官方代码仓库

来自Tongyi-MAI的上游Z-Image代码仓库。它是6B模型系列、检查点、报告链接以及官方推理指南的主要来源

查看项目

仓库 02

Koko-boya / Comfyui-Z-Image-Utilities

ComfyUI 实用工具节点

专为Z-Image工作流打造的ComfyUI扩展插件，包含prompt增强、图像感知prompting以及集成采样节点

查看项目

仓库 03

martin-rizzo / AmazingZImageWorkflow

ComfyUI 工作流包

适用于ComfyUI中Z-Image系列的工作流包，包含预定义风格、细化步骤与升级步骤，以及适用于GGUF和Safetensors检查点的现成配置

查看项目

仓库 04

martin-rizzo / ComfyUI-ZImagePowerNodes

ComfyUI 自定义节点

一套专为Z-Image和Z-Image-Turbo打造的自定义ComfyUI节点，包含风格辅助节点、潜在空间设置工具以及优化工作流便捷性的辅助组件

查看项目

FAQs

常见问题

关于AI Omni Video及其平台

什么是 Z-Image？

Z-Image 最适合用于什么？

Z-Image 擅长 prompt 主导的图像生成、海报创意、产品风格视觉效果，以及后续可迁移到 ComfyUI、本地运行环境或自托管设置的工作流。

Z-Image 在此处支持 image-to-image 吗？

Z-Image 在此处支持哪些宽高比？

本页面中 Z-Image 支持 1:1、4:3、3:4、16:9 和 9:16，涵盖标准正方形、竖版、横版以及适合社交平台的创意宽高比。

如何为 Z-Image 撰写更好的 prompt？

我何时应该使用 Z-Image 而非 GPT-4o 或 Seedream 4？

Z-Image 与 Z-Image-Turbo 有何区别？

我可以将 Z-Image 生成的图像用于商业用途吗？

Z-Image 是开源的吗？可以自托管吗？

还有疑问？我们随时为您提供帮助

加入Discord

在本平台上将Z-Image与其他图像模型进行对比

若Z-Image不适合你的工作流，请查看这些相关模型页面，对比prompt对齐方式、视觉风格与核心应用场景

GPT-4o 图像生成器

若需要一款用于构思、编辑以及具备独特视觉倾向的通用托管图像模型，请尝试GPT-4o

查看模型

Flux 2 图像生成器

若希望通过另一种途径获得精致的图像生成效果，且拥有差异化的prompt响应与视觉倾向，请尝试Flux 2

查看模型

Seedream 4 图像生成器

如果您希望创作产出的风格更具格调或更有电影感，不妨将 Z-Image 与 Seedream 4 进行对比。

查看模型

Qwen 2 图像生成器

如需另一款支持基于参考图像生成且输出风格各异的 prompt 驱动型图像模型，请使用 Qwen 2。

查看模型

在此页面立即测试 Z-Image

打开生成器，以 prompt 或单张参考图像作为起始，在此使用 Z-Image 实现可控的 text-to-image 生成以及简便的 single-reference 编辑。