2. 单线程性能提升
在 AI 加速系统中,一个 GPU 至少需对应 8-12 个 CPU 内核来支持,而英特尔® 至强® 6 处理器的每路内核数较上一代处理器提升多达 2 倍。其更强的单线程内核性能提升,也可加快向 GPU 传输数据的速度,助 GPU 实现更多的有效处理时间,从而缩短模型训练时间,这同样有助于优化数据预处理——这也是主控 CPU 的一项关键职能。
英特尔® 至强® 6 性能核处理器的特定型号 SKU 采用英特尔® Priority Core Turbo(英特尔® PCT)技术,能够动态地使八个高优先级内核以更高频率运行。这能够加速模型参数和权重在内存出入时的数据传输速度,并更高效地编排运行在 GPU 加速系统或使用其他加速器的系统上的任务。其余内核则以基频运行,从而优化 CPU 资源分配。英特尔® PCT 技术可为每个 GPU 配置适量的高频 CPU 内核作为其搭档,让 GPU 能够以更高能效运行,从而提升整个系统的利用率,这对需要顺序或串行处理的工作负载尤为关键。数量适当且能以更高频率运行的内核有助于实现更优的热设计功耗 (TDP)。
• 每 CPU 多达 128 个性能核,与上一代处理器相比,每路内核数提升多达 2 倍。
• 采用英特尔® PCT 技术的英特尔® 至强® 6776P 处理器(64 核)部分内核能够以更高的 4.6 GHz 频率运行与英特尔® 至强® 6767P 处理器相比,这一频率提升高达 17%4。