首页 > 英特尔 > AI算力暴增至120TOPS 英特尔Lunar Lake架构解析
2024
06-06

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

随着下一代AI PC硬件核心Lunar Lake的发布,英特尔4年5个制程节点演进也逐步迎来富有革命性的时刻。

面对AI时代指数级的算力需求增长,英特尔Lunar Lake,也就是第二代酷睿Ultra平台的CPU+GPU+NPU算力突破到了120TOPS,这将为基于其打造的AI PC赋予更加强劲、高效的AI性能体验。

在台北电脑展这一PC行业重要时间节点,英特尔率先公布了Lunar Lake平台技术细节,再次革新的架构设计,以及全新的CPU、GPU、NPU特性。

同时,各大OEM厂商也带来了基于Lunar Lake平台的新一代AIPC。那么Lunar Lake究竟能够为第二代酷睿Ultra平台带来怎样的改变?接下来,让我们一起探究全新的英特尔Lunar Lake平台。

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

·以AI为核心的多元化计算力提升

现如今,AI应用蓬勃发展,并且深入到各个领域。聊天机器人、AI智能助手、文生图、文生视频、文生音乐、降噪、扩图、代码生成、声音模拟等等应用场景为人们所熟知。

生成式AI蓬勃增长,基于AI技术的应用日新月异,多元化大模型的转换与扩散,成为AI终端负载的主流趋势。同时更需要云、端、边缘等多模态AI硬件设备的算力支持。

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

与此同时,对于像PC这样的本地化AI载体,多元化的AI应用对于CPU、GPU、NPU等核心硬件的算力要求与日俱增,单一和传统的硬件发展模式已经无法完全适应AI时代的计算要求。

因此,从Meteor Lake到如今的Lunar Lake,CPU+GPU+NPU构成的多元AI计算引擎,成为当代AI PC核心硬件的架构设计趋势。

也因此,在如何提升三大AI计算引擎算力的同时,利用制程与架构优势塑造更好的能效比,并兼顾传统计算能力的提升,成为了摆在英特尔这些上游芯片企业的最直接问题。

我们看看全新的Lunar Lake是如何做到的?

·高达120TOPS的全核心AI算力暴增

首先需要明确的一点是,Lunar Lake全新的CPU、GPU以及NPU,使得整个平台的AI计算能力达到120TOPS,相较Meteor Lake实现翻倍式提升。

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

那么这120TOPS算力是如何分配的呢?

首先,Lunar Lake采用的全新的Lion Cove性能核(P-Core)与Skymont能效核(E-Core)设计,支持VNNI以及AVX AI指令集,峰值AI算力为5TOPS

别看数字比较低,但是CPU在AI应用中往往只负责一些轻度的嵌入式AI计算任务,因此5TOPS算力足以应对这些类型AI的计算需求。

其次,全新的Xe2 GPU架构带来了67TOPS的峰值AI算力,这主要得益于新架构的XMX矩阵引擎吞吐量的进一步提升,从而使得新的锐炫GPU拥有了更强的浮点运算能力,提升了BF16、INT8等常见AI数据类型的算力。

其三,全新的NPU 4架构,带来了2倍的能效提升以及48TOPS的峰值算力。相比Meteor Lake NPU 3架构的11.5TOPS算力,可以说是提升巨大。

因此,三大硬件核心算力加在一起,就构成了Lunar Lake整体120TOPS的AI计算能力。

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

·CPU、GPU、NPU三大核心性能更强、能效比更高

了解了Lunar Lake最为核心的特性之后,我们从架构入手,看看Lunar Lake在设计上有哪些变化?

从整体来看,Lunar Lake被英特尔定位仪下一代AI PC的旗舰级SoC。它具备四大特点:

其一,降低40%能耗,带来了极富突破性的x86能效表现;

其二,达到Meteor Lake相同性能等级时,能耗只有前者的一半,从而带来了卓越的核心性能保险;

其三,全新的Xe2图形架构带来了1.5倍的图形性能提升;

其四,120TOPS全平台AI算力带来了无与伦比的AI计算能力。

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

在这样的前提下,我们来看看Lunar Lake的芯片设计。如下图所示:

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

与Meteor Lake的计算模块、图形模块、SoC模块、IO模块的架构设计相比,Lunar Lake进行了整合并直接集成了内存。

可以看到,Lunar Lake在基板上直接集成了LPDDR5x内存颗粒最高支持32GB双通道处理器芯片部分由计算模块(Compute tile)平台控制模块(Platform Controller tile)构成。

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

Lunar Lake的计算模块包含了性能核心、能效核心、GPU、媒体和显示引擎以及NPU五个区块,这部分如果做深入解读的话会比较难以理解,所以这里我们尽量把一些较为晦涩难懂的技术细节剔除,比如流水线深度、分支预测、矢量等等,只介绍这些技术细节的改变为Lunar Lake奠定了怎样的性能基础。

·全新设计的性能核与能效核带来更好的性能体验

首先,Lunar Lake的性能核代号为Lion Cove,其微架构针对性能和能效、IPC、可扩展性等方面进行了优化。如针对PPA(面积功耗)进行优化,L3共享缓存提升到12MB,存储器子系统进一步改进,引入了基于AI的电源管理,矢量与整数乱序引擎进行了拆分等等。

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

AI算力暴增至120TOPS 英特尔Lunar Lake架构解析

这一系列改进使得Lion Cove的IPC相较Meteor Lake的Redwood Cove提升14%,并且能够在相同功耗下获得更好的性能,尤其在低能耗下的性能提升幅度达到了18%。

这意味着Lunar Lake能够以更少的耗电量获取更高的性能,从而兼顾性能与续航表现。


本文》有 0 条评论

留下一个回复