探索财经奥秘,指引财富未来

英特尔详细介绍了Lunar Lake PC芯片如何实现120 TOPS

Tobias Mann 2024-06-04 11:35:54

Computex在新兴的人工智能PC世界中,一切最终都可以归结为顶端:你的神经处理单元(NPU)、GPU和/或CPU可以产生多少万亿字节大小的操作.

为了定义市场,微软将标准设定为40顶,以赢得其作为“副驾驶 PC”的称号,可以利用其人工智能的华而不实--比如其有争议的召回功能--被嵌入Windows.

到目前为止,高通和AMD已经宣布了符合这一标准的处理器.

在周二的Computex上,英特尔透露了一大堆关于其即将到来的月球湖移动处理器的信息--包括它如何提升其NPU以加入Copilot 俱乐部.

早在2023年12月推出Meteor Lake处理器时,英特尔就开始将NPU整合到其移动处理器中.

英特尔将Eteor Lake Silicon的NPU称为“NPU 3”,它能够大量生产大约11.

5个TOP--远远低于微软的目标.

英特尔声称,在LUNAR Lake上,它的NPU(称为“NPU 4”)将能够在INT8下大量生产48个TOP,并将支持FP16.

X86巨头能够通过实施一系列变化来实现这一点--最引人注目的是增加了专门用于NPU的芯片面积.

流星湖有两个NPU计算块,而月球湖将有六个.

英特尔表示,它升级了数字信号处理器,将向量计算提升了4倍-显然,这意味着整体向量性能提高了12倍.

英特尔还致力于使用人工智能来优化频率和电压曲线,以降低能耗,并将直接内存访问(DMA)增加一倍,以缓解运行大型语言模型等较重工作负载时的瓶颈.

英特尔声称:“流水线已经针对更高的频率进行了优化,NPU 4也是行业中第一批使用ML/AI技术实现流程外高达20%功耗降低的流水线之一.

”然而,NPU只是等式的一部分.

英特尔还透露,对CPU和GPU进行的几项架构改进将使芯片的总人工智能性能达到120顶,至少在最高规格的型号上是这样.

月球湖将有两个芯片--比流星湖少两个--使用英特尔的Foveros封装技术缝合在一起.

目前还不清楚这些芯片中的哪些或多少将由内部制造.

该芯片预计将使用英特尔的20A工艺技术,但正如我们之前报道的那样,有传言称,英特尔将至少在部分计算瓦片上采用台积电的3 nm工艺技术,同时努力提高内部节点的容量.

根据英特尔的说法,该芯片的新Lion Cove p核每时钟提供的指令数将比上一代增加14%,而其新的Skymount e核承诺将使AI工作负载的吞吐量提高两倍.

考虑到这一次这些芯片的核数要少得多,更高的性能可能是一件好事--最多只有4个p核和4个e核.

总体而言,如果需要的话,CPU能够提供5个TOP的人工智能性能.

与此同时,GPU仍然是TOPS性能的最大贡献者.

月球湖硅片中的8个图形核心比流星湖的处理器快约50%,可提供67个TOP.

如果你宁愿在你的GPU上运行游戏,而不是在人工智能上运行,该芯片的速度--至少根据英特尔的内部基准--快了80%.

第二个芯片名为平台控制器瓷砖,将处理I/O功能--如Wi-Fi、蓝牙、PCIe、迅雷--以及一些安全功能.

最后,月球湖将利用封装上的LPDDR5内存,类似于苹果对其M系列几代部件的做法.

显然,这确实将总内存限制在32 GB--这取决于你所做的事情,可能是也可能不是什么大事.

这并不是苹果硅片的唯一相似之处,苹果硅片在能源效率方面备受推崇.

英特尔表示,这种新的架构将是为了喝一口,而不是消耗电力.

新的集成电源控制器--加上软件优化和改进的e-core集群--应该会提振电池性能该芯片制造商声称,寿命延长了60%.

当然,英特尔并不是人工智能PC竞赛中唯一的竞争对手.

高通最近推出了NPU能够达到45 TOPS的X系列芯片.

这些部件使这家芯片制造商在x86竞争对手中占据了领先地位,微软以高通芯片作为其人工智能推进的核心,取得了领先.

不被忽视的是,AMD在本周的Computex主题演讲中展示了其Ryzen AI 300系列移动处理器,该处理器将能够在FP 16上提供50 NPU TOPS,拥有10或12个核心,并配备Radeon 800 M图形.

当然,还有苹果的新款M4,它拥有38 TOPS,大概是INT 8.

虽然这不足以满足微软Copilot功能的标准,但苹果一开始就没有计划使用它们.

因此,看来,冠军争夺战才刚刚开始. .