Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

Intel官方宣布,其数据中心、客户端和边缘AI解决方案已支持阿里云通义千问2(Qwen2)的全球发布。为了提升大模型效率,Intel对其进行了全面的软件优化,包括高性能融合算子、先进量化技术等。Intel还利用其硬件框架和工具包加速大模型推理,并获得了出色的性能。

在硬件方面,Intel Gaudi AI加速器专为生成式AI和大模型设计,最新版的Gaudi Optimum可以轻松部署新号的大模型。测试结果显示,在单颗Gaudi 2加速器上对70亿参数通义千问2模型的推理吞吐量达到良好水平;而在八颗Gaudi 2加速器上对720亿参数通义千问2模型的推理吞吐量也有显著提升。此外,通义千问2在Gaudi 2加速器上的微调也表现出色。

除了硬件加速外,Intel至强处理器也是通用平台,并适用于不同规模的数据中心。每个核心内置了Intel AMX高级矩阵扩展,能够处理多样化的AI工作负载并加速AI推理。

对于消费级用户来说,在本地部署大模型也变得容易起来。通过使用处理器内置GPU核显、NPU AI引擎或者搭配独立的锐炫显卡,消费者可以在本地体验到大模型的运行效果。

最后提到的是AI PC,在配置合理的情况下,消费者可以在自己的电脑上部署大模型。测试结果显示,在酷睿Ultra 7 165H和锐炫A770 16GB显卡上运行通义千问2都有良好的性能表现。

总之,英特尔官方为其数据中心、客户端和边缘AI解决方案提供了支持,并针对不同级别推出了多种硬件产品以满足不同需求。无论是企业级用户还是个人消费者都可以从中受益,并获得出色的大模型推理性能。

ai.zol.com.cn true https://ai.zol.com.cn/876/8765934.html report 1205 Intel官方宣布,其数据中心、客户端和边缘AI解决方案已支持阿里云通义千问2(Qwen2)的全球发布。为了提升大模型效率,Intel对其进行了全面的软件优化,包括高性能融合算子、先进量化技术等。Intel还利用其硬件框架和工具包加速大模型推理,并获得了出色的性能。在硬件方...

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部