首个中文原生DiT架构！腾讯混元文生图大模型宣布全面开源

55 阅读 0 评论 0 点赞

5月14日，腾讯旗下混元文生图大模型宣布全面开源。这款模型已经在Hugging Face和Github平台上发布，包含了完整的模型权重、推理代码以及模型算法等内容，可供企业与个人开发者免费商用。

据报道，混元文生图负责人卢清林表示，开源混元DiT的价值在于两方面。首先，这是业内首个采用中文原生架构的DiT模型，填补了开源社区的空白；其次，该模型完全开放，并与现有版本保持一致。

值得一提的是，本次开源的混元DiT采用了与Sora相同的底层关键技术——DiT架构，并且支持256字中文理解能力。此外，该模型不仅适用于文生图任务，在视频等多模态视觉生成领域也具备潜力。

据了解，为了构建混元DiT模型，腾讯团队设计了Transformer结构、文本编码器和位置编码，并搭建了完整的数据管道用于更新和评估数据，并为模型优化迭代提供支持。同时为了实现细粒度的文本理解，他们还训练了多模态大语言模型来优化图像的文本描述。最终的结果是混元DiT能够与用户进行多轮对话，并根据上下文生成并完善图像。

这一举措不仅让国内科技界感到振奋，也引发了公众对腾讯在AI领域的关注。

点赞(0) 打赏

本文分类：好选综合
本文标签：无
浏览次数：55 次浏览
发布日期：2024-05-15 04:32:32
本文链接：http://www.hhbnx.com/haoxuanzonghe/24640.html

上一篇 > 索尼2023年度第4期财报公布：PS5全球累计出货量突破5930万台！
下一篇 > 安装率约70%！理想汽车已安装超50万根家用充电桩

首个中文原生DiT架构！腾讯混元文生图大模型宣布全面开源

评论列表共有 0 条评论

发表评论取消回复

首个中文原生DiT架构！腾讯混元文生图大模型宣布全面开源

【开箱】曲面裸眼3D，开启水冷新纪元！TRYX Panorama SE 360 ARGB & Panorama 360 ARGB 一体式水冷系统

2025年7月30日科技日报

2025年7月29日科技日报

2025年7月28日科技日报

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复