5月30日,快手自研的大型人工智能模型“可图”正式对公众开放使用。这款模型支持两种功能:文生图和图生图。用户可以通过微信小程序和网页版来使用该模型。
据悉,“可图”大模型的参数规模达到十亿级别,数据来源包括开源社区、快手内部构建以及自研的人工智能技术合成。该模型覆盖了常见的千万级中文实体概念,并引入了强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。
今年初,快手内部明确了大模型应用策略,包含理解、互动和生成三个方向。应用场景包括全域大模型内容理解、AI互动、商业场景的数字人与AIGC等。
经测试发现,“可图”提供的功能包括“文生图”,同时还提供多款动漫主题、写实人像风格等供用户选择。用户每次最多可以生成四张图片。
值得注意的是,在今年三月份时,快手创始人兼CEO程一笑曾表示有信心在未来半年内使大模型综合性能达到GPT4.0水平,并且还称其开发的文生图大模型“可图”的综合性能已经超过了Midjourney V5的水平。
发表评论 取消回复