在 8 月 13 日的 Intel 架构日新闻发布会上,Intel 首席架构师 Raja Koduri 携手多位英特尔院士和架构师,详细介绍了 Intel 在六大技术支柱方面所取得的进展。
其中,10 纳米 SuperFin 技术,可以说是 Intel 有史以来最为强大的单节点内性能增强,带来的性能提升可与全节点转换相媲美。
此外,Intel 还公布了 Willow Cove 微架构和用于移动客户端的 Tiger Lake SoC 架构细节,并首次介绍了可实现全扩展的 Xe 图形架构。这些创新的架构可服务于消费类、高性能计算以及游戏应用市场。
重新定义 FinFET,10nm SuperFin 史上最强
在 10nm 制程工艺上,Intel 可以说是“精心打磨”。在 TSMC、三星电子致力于向 7nm/6nm/5nm 甚至更高级别工艺挺进的时候,Intel 最新的技术升级能带来哪些改观呢?
经过多年对 FinFET 晶体管技术的改进,Intel 正在重新定义该技术。据介绍,10nm SuperFin 技术实现了增强型 FinFET 晶体管与 Super MIM(Metal-Insulator-Metal)电容器的结合,实现了 Intel 历史上最强大的单节点内性能增强。
SuperFin 技术能够提供增强的外延源极 / 漏极、改进的栅极工艺和额外的栅极间距,并通过以下方式实现更高的性能:
- 增强源极和漏极上晶体结构的外延长度,从而增加应变并减小电阻,以允许更多电流通过通道。
- 改进栅极工艺以实现更高的通道迁移率,从而使电荷载流子更快地移动。
- 提供额外的栅极间距选项可为需要最高性能的芯片功能提供更高的驱动电流。
- 使用新型薄壁阻隔将过孔电阻降低了 30%,从而提升了互连性能表现。
- 与行业标准相比,在同等的占位面积内电容增加了 5 倍,从而减少了电压下降,显著提高了产品性能。值得一提的是,该技术由一类新型的“高 K”(Hi-K)电介质材料实现,该材料可以堆叠在厚度仅为几埃厚的超薄层中,从而形成重复的“超晶格”结构,据称该技术现在领先于其他芯片制造商。
Intel 方面透露,10nm SuperFin 技术将运用于代号为“Tiger Lake”的下一代移动处理器中。Tiger Lake 正在生产中,OEM 产品将在今年跨年的假日季期间上市。
Intel 同时透露了下一代处理器技术的路线图,将主要针对数据中心进行优化,具体细节未表,会在现有 10nm SuperFin 基础上进一步优化。
先进封装仍是重要的差异化优势
业界之前并没有在先进封装上投入太多精力,但近年来情况发生了变化。先进封装已成为各公司打造差异化优势的一个重要方面,以及一个能够提升性能、提高功率、缩小外形尺寸和提高带宽的机会。封装不仅仅是制造过程的最后一步,它正在成为产品创新的催化剂。
当今大多数封装技术中使用的是传统的“热压结合(thermocompression bonding)”技术,而“混合结合(Hybrid bonding)”正在成为这一技术的替代品。
根据 Intel 的最新发布,使用“混合结合”技术的测试芯片已在 2020 年第二季度流片,这项新技术能够加速实现 10 微米及以下的凸点间距,提供更高的互连密度、带宽和更低的功率。
通过一系列基础工具,包括将 EMIB 和 Foveros 技术相结合的创新应用(Co-EMIB)、全方位互连(ODI)技术、和全新裸片间接口(MDIO)技术,Intel 仍在不断将先进封装技术与制程工艺相结合,通过将芯片和小芯片进行封装,在新的多元化模块中将各种 IP 和制程技术与不同的内存和 I/O 单元进行混搭,实现更灵活的芯片架构。
下一代 CPU 微架构 Willow Cove 曝光
Willow Cove 是 Intel 的下一代 CPU 微架构,基于最新的处理器技术和 10nm SuperFin 技术,在 Sunny Cove 架构的基础上,提供超越代间 CPU 性能的提高,在频率以及功率效率也有极大地提升。
它还将重新设计的缓存架构引入到更大的非相容 1.25MB MLC 中,并通过 Intel 控制流强制技术(Control Flow Enforcement Technology)增强了安全性。
关于 Intel 的 Tiger Lake,之前就盛传会在显示技术、I/O 技术上进行创新。根据最新的发布来看,这些传言都得到了验证。作为首个在 SoC 架构中采用全新 Xe-LP 图形微架构的处理器,Tiger Lake 在关键计算矢量方面提供了智能性能和突破性进展,它可以对 CPU、AI 加速器进行优化,将使 CPU 性能得到超越一代的提升,并实现大规模的 AI 性能提升、图形性能飞跃,以及整个 SoC 中一整套顶级 IP,如全新集成的 Thunderbolt 4。
Tiger Lake SoC 架构提供:
- 全新 Willow Cove CPU 核心 - 基于 10nm SuperFin 技术,提升频率。
- 新 Xe 图形架构 - 具有 96 个执行单元(EUs),每瓦性能效率显著提高。
- 电源管理 - 一致性结构中的自主动态电压频率调整(DVFS),提高了全集成电压稳压器(FIVR)效率。
- 结构和内存–一致性结构带宽增加 2 倍,约 86GB/s 内存带宽,经验证的 LP4x-4267、DDR4-3200;LP5-5400 架构功能 。
- 高斯网络加速器 GNA 2.0 专用 IP,用于低功耗神经推理计算,减轻 CPU 处理。运行音频噪音抑制工作负载情况下,采用 GNA 推理计算的 CPU 利用率比不采用 GNA 的 CPU 低 20%。
- I/O- 集成 TB4/USB4,CPU 上集成 PCIe Gen 4,用于低延迟、高带宽设备对内存的访问。
- 显示 -64GB/s 的同步传输带宽用于支持多个高分辨率显示器。到内存的专用结构路径,以保持服务质量。
- IPU6-6 个传感器,具有 4K 30 帧视频、27MP 像素图像;最高 4K90 帧和 42MP 像素图像架构功能。
这意味着,Tiger Lake 将比基于 Sunny Cove 架构的上一代 Ice Lake 处理器实现飞跃,也使得与 AMD 基于 Zen3 架构处理器的竞争更加充满看点。
根据 Intel 此次释放出来的 CPU 架构路线图来看,Alder Lake 是下一代采用混合架构的客户端产品,它将结合英特尔即将推出的两种架构——Golden Cove 和 Gracemont,并将进行优化,以提供更好的效能功耗比。
Xe 图形架构奠定基础,首款针对数据中心的独立 GPU 发布
基于 Xe 图形架构,Intel 详细介绍了经过优化的 Xe-LP(低功耗)微架构和软件,可为移动平台提供高效的性能。
Xe-LP 是 Intel 目前针对 PC 和移动计算平台的最高效架构,最高配置 EU 单元达 96 组,并具有新架构设计,包括异步计算、视图实例化(view instancing)、采样器反馈(sampler feedback)、带有 AV1 的更新版媒体引擎以及更新版显示引擎等。
这将使新的终端用户功能具备即时游戏调整(Instant Game Tuning)、捕捉与流媒体及图像锐化。在软件优化方面,Xe-LP 将通过新的 DX11 路径和优化的编译器对驱动进行改进。
据介绍,首款 Xe-HP 芯片已于实验室完成启动测试,将于明年推出,功能类似于多核 GPU。Xe-HP 是业界首个多区块(multi-tiled)、高度可扩展的高性能架构,可提供数据中心级、机架级媒体性能,GPU 可扩展性和 AI 优化。涵盖了从一个区块(tile)到两个和四个区块的动态范围的计算。
针对低功耗系列的 Xe-LP,可以说是一个入门级的独立 GPU 架构。而 Xe 微架构的变体——Xe-HPG,是一种专为游戏优化的微架构,结合了 Xe-LP 效能功耗比的构建模块,利用 Xe-HP 的可扩展性对 Xe-HPC 进行了更强的配置和计算频率的优化。同时,Xe-HPG 添加了基于 GDDR6 的新内存子系统以提高性价比,且将具有加速的光线跟踪支持。
Xe-HPG 预计将于 2021 年开始发货。在高端游戏市场,是否能与 AMD 的 RDNA 2 或英伟达的 Ampere 系列一较高下,值得关注。
饱受期待的还有 Intel 在独立 GPU 方面的创新,此次曝光的有 Server GPU(SG1),是 Intel 针对数据中心的首款基于 Xe 架构的独立图形显卡。SG1 通过实现 4 个 DG1 的聚合,可以以很小的尺寸将性能提升至数据中心级别,以实现低延迟、高密度的安卓云游戏和视频流。SG1 将于今年晚些时候发货。
同时,首款基于 Xe 架构的独立图形显卡 DG1 也已投产,它是 Intel 首款基于 Xe-LP 微架构、针对 PC 的独立图形显卡。有望按计划于 2020 年开始交付。DG1 现在可在 Intel DevCloud 上供早期访问用户使用。
Intel 显卡指挥中心(IGCC)也增加了新功能,包括即时游戏调整和游戏锐化。即时游戏调整是一个专用于游戏的驱动,可以比以前更快地推送修复和优化给最终用户。而游戏锐化使用感知自适应锐化,通过一种基于计算着色器的自适应锐化算法提高游戏中的图像清晰度。此功能对于使用分辨率缩放以平衡性能和图像质量的游戏尤其有用,是 IGCC 中的一项可选功能。
10nm Ice Lake 年底推出,下一代超算 CPU 仍内置 AI 加速
数据中心处理器方面,首款基于 10nm 的至强可扩展处理器 Ice Lake 将于今年底推出。Ice Lake 产品将在跨工作负载的吞吐量和响应能力方面提供强劲性能。它将带来一系列技术,包括全内存加密、PCIe Gen 4、8 个内存通道等,以及可加快密码运算速度的增强指令集。Ice Lak 系列中也会推出针对网络存储和物联网的变体。
Sapphire Rapids 是 Intel 基于增强型 SuperFin 技术的下一代至强可扩展处理器,将提供众多行业标准技术,包括 DDR5、PCIe Gen 5、Compute Express Link 1.1 等。
据悉,Sapphire Rapids 将是美国阿贡国家实验室“极光”超级计算机系统(Aurora Exascale)中使用的 CPU,它将延续英特尔的内置人工智能加速策略,使用一种名为先进的矩阵扩展(AMX)的新加速器。Sapphire Rapids 预计将于 2021 年下半年开始首批生产发货。
FPGA 方面,Intel 展示了下一代 224G-PAM4 TX 收发器,以示其在先进 FPGA 技术上的不断创新和连续三代收发器领域的领先地位。
oneAPI Gold 版本将于今年晚些时候推出
Intel 在软件领域的策略是“一个架构”,围绕架构进行扩展。7 月发布的第八版的 oneAPI Beta,为分布式数据分析带来了新的功能和提升,包括渲染性能、性能分析以及视频和线程文库。
oneAPI Gold 版本将于今年晚些时候推出,为开发人员提供在标量、矢量、距阵和空间体系结构上保证产品级别的质量和性能的解决方案。
结语
在 2018 年的 Intel“架构日”上,Intel 就提出了扎根于六大技术支柱——制程和封装、架构、内存和存储、互连、安全、软件,将通过横跨这六大技术的全方位计算创新,驱动计算性能的指数级提升。
究其原因,不断变化的市场和摩尔定律的现状要求 Intel 必须进行技术战略变革,需要从传统的“Tick-Tock”战略模式走向更成熟、更适应未来的新模式。
从这些最新公开的信息看,Intel 这六大技术支柱都在同步进展中,并在引领业界进入一个更多元的计算世界。而不论是晶体管创新,还是架构升级,或是先进封装技术,全方位的计算创新才能满足海量数据爆发对计算力的更高要求。