Qwen-Image

Qwen-Image 是阿里通义千问团队于2025年8月5日开源的200亿参数图像生成基础模型,采用MMDiT架构,专为复杂文本渲染与高精度图像生成设计。

收录时间:
2025-07-05
Qwen-ImageQwen-Image

Qwen-Image 是阿里通义千问团队于2025年推出的开源图像生成模型,作为 Qwen 系列的重要成员,专注于高质量图像生成与复杂文本渲染任务。该模型基于 MMDiT 架构构建,参数规模达到 200 亿(20B),在处理多语言、多字体、多行文本及复杂排版布局方面展现出突出能力。

Qwen-Image官网入口网址:https://github.com/QwenLM/Qwen-Image

Qwen-Image插图

Qwen-Image 在中英文混合文本、艺术字设计、海报排版等场景中表现优异,尤其在 LongText-Bench 和 ChineseWord 等基准测试中取得领先成绩。除文本到图像生成外,模型还支持多种图像编辑操作,包括风格迁移、对象增删、细节增强以及文字内容修改,能够满足品牌视觉设计、营销素材制作、演示文稿配图等专业需求。

该项目采用 Apache 2.0 开源协议,允许商用和学术研究使用。用户可通过 Hugging Face 或 ModelScope 平台获取模型,并支持本地部署或云端调用。Qwen-Image 接受结构化提示输入(如 <|system|><|user_text|> 标记),便于精确控制生成内容的语言、风格与布局,适用于 logo 设计、宣传海报、AI 艺术字等多种创意应用场景。

相关导航