

Intel官方宣布,其数据中心、客户端和边缘AI解决方案已支持阿里云通义千问2(Qwen2)的全球发布。为了提升大模型效率,Intel对其进行了全面的软件优化,包括高性能融合算子、先进量化技术等。Intel还利用其硬件框架和工具包加速大模型推理,并获得了出色的性能。
在硬件方面,Intel Gaudi AI加速器专为生成式AI和大模型设计,最新版的Gaudi Optimum可以轻松部署新号的大模型。测试结果显示,在单颗Gaudi 2加速器上对70亿参数通义千问2模型的推理吞吐量达到良好水平;而在八颗Gaudi 2加速器上对720亿参数通义千问2模型的推理吞吐量也有显著提升。此外,通义千问2在Gaudi 2加速器上的微调也表现出色。
除了硬件加速外,Intel至强处理器也是通用平台,并适用于不同规模的数据中心。每个核心内置了Intel AMX高级矩阵扩展,能够处理多样化的AI工作负载并加速AI推理。
对于消费级用户来说,在本地部署大模型也变得容易起来。通过使用处理器内置GPU核显、NPU AI引擎或者搭配独立的锐炫显卡,消费者可以在本地体验到大模型的运行效果。
最后提到的是AI PC,在配置合理的情况下,消费者可以在自己的电脑上部署大模型。测试结果显示,在酷睿Ultra 7 165H和锐炫A770 16GB显卡上运行通义千问2都有良好的性能表现。
总之,英特尔官方为其数据中心、客户端和边缘AI解决方案提供了支持,并针对不同级别推出了多种硬件产品以满足不同需求。无论是企业级用户还是个人消费者都可以从中受益,并获得出色的大模型推理性能。
发表评论 取消回复