Qwen-Image

167 0 0

Qwen-Image 是阿里通义千问团队于2025年8月5日开源的200亿参数图像生成基础模型，采用MMDiT架构，专为复杂文本渲染与高精度图像生成设计。

收录时间：

2025-07-05

打开网站手机查看

Qwen-Image

打开网站

Qwen-Image 是阿里通义千问团队于2025年推出的开源图像生成模型，作为 Qwen 系列的重要成员，专注于高质量图像生成与复杂文本渲染任务。该模型基于 MMDiT 架构构建，参数规模达到 200 亿（20B），在处理多语言、多字体、多行文本及复杂排版布局方面展现出突出能力。

Qwen-Image官网入口网址：https://github.com/QwenLM/Qwen-Image

Qwen-Image 在中英文混合文本、艺术字设计、海报排版等场景中表现优异，尤其在 LongText-Bench 和 ChineseWord 等基准测试中取得领先成绩。除文本到图像生成外，模型还支持多种图像编辑操作，包括风格迁移、对象增删、细节增强以及文字内容修改，能够满足品牌视觉设计、营销素材制作、演示文稿配图等专业需求。

该项目采用 Apache 2.0 开源协议，允许商用和学术研究使用。用户可通过 Hugging Face 或 ModelScope 平台获取模型，并支持本地部署或云端调用。Qwen-Image 接受结构化提示输入（如 <|system|> 和 <|user_text|> 标记），便于精确控制生成内容的语言、风格与布局，适用于 logo 设计、宣传海报、AI 艺术字等多种创意应用场景。

Qwen-Image

相关导航

孟子 GPT

Whisper

MiniMax

眸思大模型

SadTalker

APUS大模型

有道智云AI开放平台

书生通用大模型体系