Xilinx推出可与GPU性能相匹配的新FPGA卡

Xilinx推出了一款新的FPGA卡,即Alveo U50,它声称可以在人工智能(AI)和机器学习领域与GPU的性能相媲美。该公司声称该卡是业界首款支持PCIe Gen 4的低调自适应加速器,其吞吐量比PCIe Gen3高出一倍。它于2017年完成,但支持它的卡和主板进入市场的速度很慢。

Alveo U50为客户提供可编程的低配置和低功耗加速器平台,该平台专为横向扩展架构和任何服务器部署,内部,云端和边缘的特定于域的加速而构建。Xilinx声称,与CPU相比,Alveo U50的吞吐量和延迟提高了10到20倍。有一件事是肯定的,它在竞争中击败了竞争力。它具有75瓦的功率范围,可与台式机CPU相媲美,远远优于Xeon或GPU。

对于加速的网络和存储工作负载,U50卡可帮助开发人员通过将计算更接近数据来识别并消除延迟和数据移动瓶颈。

赛灵思 Xilinx Alveo U50

Alveo U50卡是Alveo产品系列中第一款采用半高半长外形封装的产品。它运行Xilinx UltraScale + FPGA架构,具有高带宽内存(HBM2),每秒100千兆位(100 Gbps)的网络连接,并支持PCIe Gen 4和CCIX互连。得益于8GB的HBM2内存,数据传输速度可达400Gbps。它还支持NVMe-over-Fabric,用于高速SSD传输。

这是很多性能包装在一张小卡片中。

Xilinx对Alveo U50的功能大加夸大:

深度学习推理加速(语音转换):与仅支持GPU的语音转换性能相比,每个节点的延迟降低了25倍,吞吐量提高了10倍,并显着提高了每个节点的功效。

数据分析加速(数据库查询):运行TPC-H查询基准测试,与内存CPU相比,Alveo U50每小时吞吐量提高4倍,运营成本降低3倍。

计算存储加速(压缩):与仅CPU节点相比,可提供20倍的压缩/解压缩吞吐量,更快的Hadoop和大数据分析,以及每个节点成本降低30%以上。

网络加速(电子交易):与仅CPU延迟10us相比,延迟时间缩短20倍,交易时间低于500ns。

财务建模(网格计算):运行蒙特卡罗模拟,与仅GPU性能相比,Alveo U50的功效提高了7倍,从而更快地实现了洞察力,确定性延迟并降低了运营成本。

Alveo U50现已开始提供样品,并正在进行OEM系统认证。一般情况定于2019年秋季。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。