百度AI战略升级 百万参数大模型免费开放

5月21日,百度公司正式宣布其两款大模型ERNIE Speed和ERNIE Lite将免费开放使用。这些“轻量级”大模型使用小型专家模型,但具有与通用大模型相似的效果,并且其推理成本更低廉。

ERNIE Speed在推理场景下支持最高128k的上下文长度,在处理知识问答等任务时能更好地处理上下文依赖关系,生成更连贯准确的预测或回答。

ERNIE Lite参数量相比ERNIE Speed更小,非常适合搭载在低算力的AI加速卡上进行推理任务。同时兼顾了模型效果和推理性能,大幅降低了客户应用落地的成本。

近期国内AI大模型市场竞争激烈。上周,字节跳动旗下豆包主力模型企业市场定价仅为0.0008元/千Tokens;DeepSeek-V2每百万tokens价格仅1元;智谱AI的glm3-turbo价格也调整至每百万tokens 1元。

今天上午阿里云宣布通义千问GPT-4级主力模型Qwen-Turbo、Qwen-Plus、Qwen-Long等9款大模型全面降价,其中Qwen-Long API输入价格从0.02元/千Tokens降至0.0005元/千Tokens,最高降幅达到97%。

ai.zol.com.cn true https://ai.zol.com.cn/873/8734819.html report 789 5月21日,百度公司正式宣布其两款大模型ERNIE Speed和ERNIE Lite将免费开放使用。这些“轻量级”大模型使用小型专家模型,但具有与通用大模型相似的效果,并且其推理成本更低廉。ERNIE Speed在推理场景下支持最高128k的上下文长度,在处理知识问答等任务时能更好地处理上...

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部