Qwen-Image-Layered – 阿里推出的AI图像编辑模型

互联网 来源:AI工具集 2025-12-22 13:05:12

Qwen-Image-Layered是什么

Qwen-Image-Layered是阿里团队推出的AI图像编辑模型,能将普通图片自动拆分为独立的RGB透明图层,实现类似Photoshop的分层编辑功能。通过注意力机制和位置编码动态拆分图层,支持3-10层的灵活分解,允许对单层进行缩放、着色等操作而不影响其他部分。相比传统AI修图”牵一发而动全身”的问题,模型在Hugging Face开源测试中显示,色彩还原误差仅为0.0033,透明度准确率高达0.916,显著优于现有技术。

Qwen-Image-Layered的主要功能

  • 图像分层:将单一 RGB 图像分解为多个 RGBA 图层,每个图层语义独立,便于后续编辑。
  • 独立编辑:各图层可单独操作,如调整大小、重新定位、重新着色等,不影响其他图层。
  • 高保真操作:支持高保真基本操作,如清晰删除对象、无失真调整大小、自由移动对象等。
  • 灵活分解:支持可变数量的图层分解,还可递归分解,实现无限分解,满足不同编辑需求。
  • 数据管道:建立从 Photoshop 文档提取多层图像的管道,解决高质量多层训练数据稀缺问题。

Qwen-Image-Layered的技术原理

  • RGBA-VAE:通过统一 RGB 和 RGBA 图像的潜在表示,为多层图像的生成和分解提供基础框架。
  • VLD-MMDiT 架构:采用可变层分解的 MMDiT 架构,能够灵活地将图像分解为不同数量的图层。
  • 多阶段训练策略:结合预训练的图像生成模型,通过多阶段训练,使其适应多层图像分解任务,提升模型性能。
  • 数据管道:从 Photoshop 文档中提取和标注多层图像,建立高质量的训练数据集,解决数据稀缺问题。
  • 扩散模型:基于扩散模型的生成机制,逐步从噪声中重建图像的多层表示,实现高质量的图层分解。

Qwen-Image-Layered的项目地址

  • Github仓库:https://github.com/QwenLM/Qwen-Image-Layered

  • HuggingFace模型库:https://huggingface.co/Qwen/Qwen-Image-Layered

  • arXiv技术论文:https://arxiv.org/pdf/2512.15603

  • 在线体验Demo:https://huggingface.co/spaces/Qwen/Qwen-Image-Layered

Qwen-Image-Layered的应用场景

  • 广告设计:快速分解图像为多个图层,方便对广告中的元素进行独立编辑,如更换背景、调整产品位置等。
  • 影视后期:对影视画面中的角色、道具等进行分层处理,便于特效添加、颜色校正等操作。
  • 创意设计:设计师可以轻松分解创意图像,对不同元素进行独立修改,激发更多创意灵感。
  • 图像修复:将图像分解后,可单独修复受损图层,而不影响其他部分,提高修复效率。
  • 教育演示:在教学中,将复杂图像分解为简单图层,帮助学生更好地理解图像构成和编辑原理。
延伸阅读

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
内容推荐