世界对互联网的运用正在发生范式转变:从集中式计算和数据存储集群转向更具分布式特点的架构,可以处理云端、边缘以及云边之间无所不在的数据。这种不断演进的云边协同基础设施模式融合了云的巨大规模和计算能力与网络带宽的指数级增长优势,可以从云一直扩展到边缘。
而在边缘,数据就在手边,因此可以更快地做出更好的决策。英特尔相信这种新模式是一种超级技术力量,它正影响着全球数字化转型并推动着数字化复兴。正因如此,英特尔集中力量推出一系列新技术,实现无所不在的计算、从云到边缘的基础设施、无处不在的连接以及人工智能。这种全球性的范式转变正在推动全球半导体用量的爆炸式增长,并为英特尔和整个科技行业带来巨大机遇。英特尔高度灵活和可编程的逻辑产品组合在加速这些技术转变方面发挥着至关重要的作用。
借助英特尔的旗舰产品英特尔® Agilex™FPGA 家族,英特尔的客户能够在各个终端市场和应用中实现更高的性能、更出色的能效。英特尔将不断利用英特尔® Agilex™ M系列家族的变体产品乘势而上。英特尔® Agilex™ M系列FPGA 吸纳了多项功能创新和全新特性,通过几个维度显著提高了绝对性能和性能功耗比,这对开发新的、更强大、更高效的系统来说至关重要。这些创新和新特性包括:
■ 行业内极为出色的FPGA 内存带宽
■ 行业内 HBMFPGA 中极为出色的 DSP计算密度
■ 与 7 纳米FPGA 其他产品相比,逻辑结构性能功耗比大幅提升
全新英特尔® Agilex™ M系列FPGA 的强大之处在于,其为行业提供的高速网络、计算和存储加速,足以满足网络、云和嵌入式边缘应用更为野心勃勃的性能和容量目标。
“M”代表着“内存 (Memory)”
“M 系列”中的“M”表示“内存”。内存更多更快无疑是英特尔® Agilex™ M系列FPGA 一个突出且重要的优势。几乎无一例外,高级应用需要从快到更快再到最快的内存层次结构,同时又要让设计团队能够在内存带宽和时延与内存容量之间权衡取舍。英特尔® Agilex™ M系列FPGA 具有广泛而灵活的内存层次结构,囊括了超低时延、超高带宽的片上 SRAM,HBM2e(高带宽内存)DRAM 堆栈形式的更大容量、高带宽的封装内存,支持包括 DDR4、DDR5 和 LPDDR5 在内的快速、大容量外部同步 DRAM (SDRAM),以及超大容量、非易失性英特尔® 傲腾™ 持久内存。
所有英特尔® Agilex™FPGA,包括 M 系列FPGA,都集成了 MLAB 和 M20K 模块形式的快速片上 SRAM。这些 SRAM 集成到FPGA 的可编程逻辑结构中意味着它们会紧邻将与这些存储器交换数据的逻辑单元。有些英特尔® Agilex™ M系列FPGA 还集成了 HBM2e 内存堆栈形式的封装 HBM,由硬核内存控制器管理。
英特尔® Agilex™ M系列FPGA 通过集成两个 HBM2e DRAM 堆栈进一步扩大了 HBM 封装范围。英特尔® Agilex™ M系列FPGA 中的两个封装 HBM2e DRAM 堆栈提供多达 32 GB 的内存容量和每个 HBM2e 堆栈高达 410 GB/s 的内存带宽,使总封装 HBM2e 内存带宽高达 820 GB/s。与上一代英特尔® Stratix® 10 MXFPGA 相比 60% 的带宽增幅使得设计人员能够将英特尔® Agilex™ M系列FPGA 用于更具挑战性的系统设计1。
对于需要额外高速 DRAM 容量的应用,英特尔® Agilex™ M系列FPGA 还通过集成的高效硬核内存控制器支持外挂 DDR5 和 LPDDR5 SDRAM。另外,英特尔® Agilex™ M系列FPGA 与英特尔® 傲腾™ 持久内存结合,可为系统设计人员在针对具体系统构建内存层次结构时提供额外的灵活性和更大的内存容量。
DDR5 和 LPDDR5 SDRAM 是目前市场上最快的主流 SDRAM DIMM。英特尔® Agilex™ M系列FPGA 中每个独立的内存控制器都可以以 5600 MT/s 的速度运行 DDR5 SDRAM,数据宽度高达每通道 40 位(加上 ECC 位)。当 HBM2e 和 DDR5 内存带宽相结合时,附带 8 个 DDR5 SDRAM DIMM 的英特尔® Agilex™ M系列FPGA 理论上可实现 1.099 TB/s 的最大内存带宽。
在FPGA 的可编程逻辑结构与 HBM2e 和 DDR5 存储器之间进行 1 TB/s 的数据传输可能是一个挑战。这一潜在瓶颈促使英特尔对英特尔® Agilex™ M系列FPGA 进行了另一项创新研发:硬核内存片上网络 (NoC)。该内存 NoC 充当了将封装 HBM2e DRAM、外部 DDR5 SDRAM、FPGA 高速外部 I/O 连接到FPGA 逻辑结构的高速公路。双内存 NoC 的总峰值带宽为 7.52 TB/s。这的确是巨大的片上带宽。它不会消耗FPGA 的片上可编程逻辑资源,因而大大降低了出现内存瓶颈的可能性。
快速 I/O 和快速计算
能够顺利地将数据移入和移出该内存层次结构以及整个FPGA 对于实现具有挑战性的系统级性能目标至关重要;不过,同样重要的是,设计师还必须能够访问其他高带宽资源,以便在外部系统和FPGA 之间移动数据。英特尔® Agilex™ M系列FPGA 集成多达 72 个高速 SERDES 收发器,其中多达 8 个收发器都可以使用 PAM4 调制技术以 116 Gbps 的速度运行,实现以高数据速率在FPGA 与系统其余部分之间交换数据。英特尔® Agilex™ M系列 SERDES 收发器支持当今各种新兴的行业标准高速串行协议(包括 400 G 以太网),并且可以直接连接到高级 CPU(包括使用 PCIe Gen5 和 CXL 接口协议的全新英特尔® 至强® CPU)。
数据进入FPGA,通常必须通过各种计算算法对其进行处理。英特尔® Agilex™ M系列FPGA 的可编程逻辑结构速度极快,可以以高数据速率实现各种计算算法。此外,这种可编程逻辑结构还集成了多达 12,300 个精度可调的浮点 DSP 模块。这些模块能够实现 18.5 TFLOPS 单精度浮点运算或 88.6 TOPS INT8 整数运算,满足处理更繁重的计算负载的需求。