

5月21日,百度公司正式宣布其两款大模型ERNIE Speed和ERNIE Lite将免费开放使用。这些“轻量级”大模型使用小型专家模型,但具有与通用大模型相似的效果,并且其推理成本更低廉。
ERNIE Speed在推理场景下支持最高128k的上下文长度,在处理知识问答等任务时能更好地处理上下文依赖关系,生成更连贯准确的预测或回答。
ERNIE Lite参数量相比ERNIE Speed更小,非常适合搭载在低算力的AI加速卡上进行推理任务。同时兼顾了模型效果和推理性能,大幅降低了客户应用落地的成本。
近期国内AI大模型市场竞争激烈。上周,字节跳动旗下豆包主力模型企业市场定价仅为0.0008元/千Tokens;DeepSeek-V2每百万tokens价格仅1元;智谱AI的glm3-turbo价格也调整至每百万tokens 1元。
今天上午阿里云宣布通义千问GPT-4级主力模型Qwen-Turbo、Qwen-Plus、Qwen-Long等9款大模型全面降价,其中Qwen-Long API输入价格从0.02元/千Tokens降至0.0005元/千Tokens,最高降幅达到97%。
发表评论 取消回复