英特尔® Agilex™ D 系列 FPGA 和 SoC。产品非常适合需要更高性能、更低功耗和更小外形规格的中端 FPGA 应用,例如演播室摄像机、8K 视频传输和无线基础设施(宏基站、前传和后传以及无线单元)。
最初的英特尔® Agilex™ FPGA 和 SoC 家族一经问世,便获得了市场的广泛认可,之后英特尔不懈创新,赋予英特尔® Agilex™ FPGA 架构新的特性和不同特点,使这一家族适配的应用范围更加广泛。这些新特性与新功能在支持并发工作负载需求方面的重要性日益凸显。当前,大多数中端应用呈现的新兴趋势是要求具备更低的功耗和更高的性能。而应对性能需求不断增加的局面,正是英特尔制程工艺的用武之地。
全新英特尔® Agilex™ D 系列 FPGA 和 SoC 具备多项新特性,例如升级版硬核处理器系统 (HPS)、采用 AI 张量模块的增强型数字信号处理 (DSP)、MIPI I/O 支持和固核 IP 时间敏感网络 (TSN) 控制器。同时,该系列还具备这一家族其他产品拥有的重要特性,包括第二代英特尔® Hyperflex™ FPGA 架构和高速 SerDes 收发器。上述特性相结合,使英特尔® Agilex™ D 系列 FPGA 广泛适用于各种中端 FPGA 应用。
英特尔利用半导体制程工艺上的进步,成功打造出英特尔® Agilex™ D 系列 FPGA,从而将英特尔® Agilex™ FPGA 产品组合扩展到逻辑密度更低的应用。英特尔® Agilex™ FPGA 和 SoC 家族早期成员采用的是英特尔 10 制程工艺节点,而英特尔® Agilex™ D 系列产品采用的是英特尔 7 制程工艺技术。这项技术现已成为英特尔用来制造第 12 代英特尔® 酷睿™ CPU 和第四代英特尔® 至强® 可扩展服务器用 CPU 等大容量 CPU 的成熟制造工艺。全新英特尔® Agilex™ D 系列 FPGA 和 SoC 采用英特尔 7 制程工艺与第二代英特尔® Hyperflex™ FPGA 架构。
英特尔 7 制程工艺的运用使英特尔打造的可编程逻辑器件能将快速 I/O 电路(包括 28 Gbps 高速 SerDes 收发器、灵活的通用 I/O 组以及可编程逻辑和固核 IP 模块)集成在一个单体硅晶片上。而通过英特尔 7 制程工艺的厚栅氧化层晶体管变体,英特尔® Agilex™ D 系列 FPGA 可同时拥有高速 I/O 组和可支持在 3.3 V 电压下运行的高压 I/O 组,如下图所示:
此外,英特尔® Agilex™ D 系列 FPGA 和 SoC 产品还配备了若干硬核 IP 模块。这些首次应用于英特尔® Agilex™ FPGA 家族的模块包括采用 AI 张量模块的增强型 DSP、时间敏感网络模块、MIPI 接口和由 1 个 Arm Cortex-A76 双核处理器和 1 个 Arm Cortex-A55 双核处理器组成的升级版硬核处理器系统。借助 Arm 的 DynamIQ 多核处理器技术,软件开发人员可利用 Arm Cortex-A76 CPU 和 Cortex-A55 CPU 组成单一的融合集群,进而为多种应用带来更低的功耗和更好的性能。
这些英特尔® Agilex™ FPGA 和 SoC 新品的 FPGA 逻辑结构中加入了采用 AI 张量模块的增强型数字信号处理 (DSP) 功能模块。该模块承袭了英特尔® Agilex™ FPGA 家族早期产品配备可变精度 DSP 模块,支持多种 AI 工作负载的设计。除此之外,新品还增加了源自英特尔® Stratix® 10 NX FPGA 所用张量模块的特性。采用 AI 张量模块的增强型 DSP 具备两种重要的新操作模式:面向 AI 的张量处理模式和可支持 FFT 滤波器和复数 FIR 滤波器等信号处理应用的复数运算模式。
第一种模式利用 INT8 张量模式实现 AI 增强,该模式可在采用 AI 张量模块的增强型 DSP 中提供 20 次 INT8 乘法运算,与英特尔® Agilex™ FPGA 家族早期成员相比,INT8 计算密度提高了 5 倍。张量模式使用双列张量结构,同时具备 INT32 和 FP32 级联和累加两种能力,并且还支持块浮点指数,可提升推理准确性和低精度训练效果。除此之外,可变精度 DSP 功能模块中的 AI 功能也得到了增强。当前,张量模式已从 4 个 INT9 乘法器升级到 6 个 INT9 乘法器。这种模式对以 AI 为中心的张量数学运算和各种 DSP 应用都非常有用。
第二种新模式是复数运算模式,可在进行复数乘法运算时将张量模块的性能提高一倍。以往进行复数乘法运算时通常需要两个 DSP 模块,但这一英特尔® Agilex™ FPGA 和 SoC 家族新品却可以在一个采用 AI 张量模块的增强型 DSP 内进行 16 位定点复数乘法运算。
英特尔® 软件工具将更具易用性,可进一步优化 AI 资源的功耗与占用面积。这是 FPGA 行业中目前非常少见的一键式单一工作流,不仅能够整合针对特定吞吐量和时延目标的 AI 框架(例如 TensorFlow 和 PyTorch),还可以创建自定义大小的推理 IP。
这些新的硬件特性加上高性能、低功耗的 FPGA 逻辑结构使英特尔® Agilex™ D 系列 FPGA 和 SoC 非常适合从网络边缘到核心等不同市场的中端 FPGA 应用,包括无线和有线通信、视频和音频广播设备、工业应用、测试和测量产品、医疗电子设备以及军事/航空航天应用。