

5月14日,腾讯宣布其混元文生图大模型已经升级并对外开源。这个大模型采用了与Sora一致的DiT架构,是业界首个中文原生的DiT文生图开源模型,支持中英文双语输入及理解,参数量达到15亿。该模型包含模型权重、推理代码、模型算法等完整信息,并且可以免费商用。
混元DiT是一个基于Diffusion transformer的文本到图像生成模型,具有中英文细粒度理解能力。它能够与用户进行多轮对话,并根据上下文生成并完善图像。此外,运行该模型需要支持CUDA的英伟达GPU,最低显存为11GB,在Linux上测试英伟达V100和A100 GPU也取得了良好效果。
值得一提的是,腾讯混元大模型、阿里通义千问、360智脑和百度文心一言成为首批通过评测的国产大模型。这些大模型在技术性能和应用领域都有着出色的表现,未来将会发挥重要作用。
发表评论 取消回复