新闻

Xilinx推出最雄心勃勃的Accelerator平台

没有
2018年10月3日

创建人:Michael Feldman

赛灵思已经推出了Versal,这是一个基于其异构自适应计算机加速器平台(ACAP)的新产品系列。最初的产品系列将FPGA技术与Arm CPU内核,DSP和AI处理引擎集成在一起。新平台旨在加速在数据中心和边缘设备上运行的各种机器学习和数据密集型工作负载。

Versal是多功能和通用的代名词,代表了Xilinx的“ Everest”架构(R&四年来,公司为此付出了10亿美元。在最基本的层次上,ACAP和最初的Versal实现将基于固定功能硬件的许多特定领域和通用架构与可重配置的FPGA架构相结合。

 

 

这种方法是对2000年代初期Dennard缩放比例的消失以及最近摩尔定律速度放缓导致的处理器性能停滞的一种反应。此外,根据赛灵思首席执行官Victor Peng的说法,处理器设计周期太长,无法满足当今对新解决方案的需求。 Peng说:“这正是该行业在需要的时刻所需要的。” Peng本周在圣何塞的Xilinx开发者论坛上推出了Versal产品系列。

Versal的新产品分为六个产品系列,每个产品系列都针对特定的应用程序配置文件。溜槽中的前两个将是针对机器学习推理和高级信号处理的AI Core系列,以及旨在为各种数据中心工作负载进行内联加速而设计的Prime系列。未来的Versal系列包括AI Edge,AI RF,Premium和HBM。整个产品集总结如下。 

最终,Versal产品将与Intel的类似FPGA产品竞争,但是Xilinx目前专注于将这些设备定位为CPU和GPU的更高性能的替代品,而CPU和GPU则目前在ACAP所针对的应用领域占据主导地位。例如,在数据中心,该公司声称,对于图像识别推理,Versal产品运行这些应用程序的速度比Intel Xeon Platinum CPU快43倍,比NVIDIA Tesla V100 GPU快2到8倍,是5倍。比独立FPGA更快。同样,对于诸如财务风险分析,基因组学和弹性搜索之类的应用程序,Versal可以分别以89、90和91的系数超越传统的CPU实现。

AI Core系列主要针对快速发展的机器学习推理市场,根据巴克莱研究公司(Barclays Research)最近的一份报告,该市场将在未来十年发展成比机器学习培训更大的市场。该系列产品包括一个FPGA,128至400个AI引擎,一个双核Arm Cortex-A72应用处理器,一个双核Arm Cortex-R5实时处理器,256KB嵌入式存储器和1,900多个DSP浮点引擎。

FPGA组件构成了平台的自适应引擎,集成了多达190万个系统逻辑单元和将近90万个LUT。内存子系统由超过130 Mb的UltraRAM,高达34 Mb的Block RAM,28 Mb的分布式RAM和32Mb的Accelerator RAM块组成,可以从平台上的任何处理器引擎进行访问。该系列还具有PCIe Gen4 x8和x16接口,CCIX主机接口,32G SerDes以及2至4个集成DDR4内存控制器。所有这些组件都通过一个数TB /秒的片上网络(NoC)粘合在一起。

AI Core系列中有五种产品,其中最顶级的产品可提供147个INT8性能的峰值峰峰值(TOP)进行推理,其中大部分是由AI向量处理引擎提供的。为了比较起见,NVIDIA最高性能的GPU用于推理, 新款特斯拉T4,提供130个INT8 TOP。

与Core AI产品相比,Versal Prime系列代表了一组更加通用的产品,并且包括一个更大的FPGA(多达210万个系统逻辑单元和984,000个LUT)。它还具有相同的基本相同的Arm处理器设置,大量的存储容量以及多达3,080个DSP引擎,但没有AI引擎组件。这些产品适用于医学成像,网络和存储加速,通信测试设备以及航空电子控制等应用。

就像您想象的那样,对这些复杂的设备进行编程将需要做一些事情。为此,Xilinx为开发环境提供了相关的语言支持(C,C ++和Python),驱动程序,中间件,库和特定于应用程序的框架支持。该公司承诺明年将在软件堆栈上发布更多细节。

尽管Xilinx已经通过抢先体验计划吸引了“多个关键客户”,但Versal AI Core和Prime产品计划于2019年下半年全面上市。如果有任何激起您的兴趣,该公司已经发布了有关新产品系列的大量文档,可以找到这些文档 这里.