英特尔发布 Xe2“Battlemage”GPU 架构,最初以低功耗形式推出 Lunar Lake CPU

英特尔在英特尔技术之旅期间发布了有关其即将推出的代号为“Battlemage”的 Xe2 GPU 架构的更多细节,甚至在 Computex 主题演讲之前。虽然之前关于英特尔下一代 GPU 架构可能延迟甚至完全取消的传言现在似乎没有根据,但看起来 Battlemage 不会同时以 GPU 和 iGPU 形式推出。英特尔计划首先推出带有 Lunar Lake 处理器的低功耗版本,然后在不可告人的时间发布台式机和 HPC 版本。因此,英特尔只显示了 Lunar Lake 芯片中 iGPU 的估计性能提升。

借助 Xe2 Battlemage GPU 架构,英特尔专注于提供更高的利用率、改进的工作分配和减少软件驱动程序开销。当谈到性能比 Xe Alchemist 提高时,英特尔承诺将绘制调用改进 12.5 倍,计算调度提高 7 倍,网格着色器调度提高 4.1 倍,仅举最大的收益。尽管如此,对整体性能影响较大的方面,如顶点处理、曲面细分、射线三角形和迹线射线,最多提高了 2 倍。

每个 Xe2 内核都具有 8 个 512 位矢量引擎、8 个 2048 位 XMX 引擎、64b 原子运算支持和 192 KB 共享 L1 缓存/SLM。与 Xe Alchemist 类似,Xe2 Battlemage 具有高度可扩展性,并且将根据产品堆栈提供一定数量的核心。例如,Lunar Lake iGPU 将配备多达 8 个 Xe2 内核、64 个矢量引擎、2 个几何管线、8 个采样器、4 个像素后端、8 个光线追踪单元和 8 MB 二级缓存。

英特尔使用 SIMD16 原生 ALU 升级了所有矢量引擎,这些 ALU 也支持 SIMD32 运算,而 Xe 矩阵扩展支持 INT2、INT4、INT8。FP16 和 BF16 操作。FP16 操作的处理速度已提高到 2048 OPS/小时,INT8 速度可以达到 4096 OPS/小时。

为了减少延迟并改善硬件/软件握手,英特尔正在引入渲染切片作为渲染引擎的基本模块。这些切片也是可扩展的,可以根据 GPU 类型进行堆叠和优化。此外,光线追踪单元也得到了改进,包括 3 个遍历管线、18 个箱形交叉点和 2 个三角形交叉点。

英特尔预计 Lunar Lake 处理器上的 Xe2 iGPU 将比 Meteor Lake 上的 Xe Alchemist 型号快 50%。另一项改进是支持 eDisplayPort 1.5 的新显示引擎,这将提高能效并改善自适应同步功能,同时减少笔记本电脑显示器上的抖动。此外,英特尔正在使用专用的 8 MB 缓存更新媒体引擎,这应该可以提高编码工作负载的能效,此外,它还引入了对新的 VVC(多功能视频编码)标准的支持,允许 AV1 质量,文件大小减少 10%。

来源:IT时代网

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
英特尔发布 Xe2“Battlemage”GPU 架构,最初以低功耗形式推出 Lunar Lake CPU

精彩评论