五八同城,从芯片到体系:FPGA加速卡的开展进程与展望,物美超市

admin 5个月前 ( 03-29 06:32 ) 0条评论
摘要: 从芯片到系统:FPGA加速卡的发展历程与展望...

来历:内容来自「老石谈芯」,谢谢。

一个重要的趋势

作为加快云数据中心的重要组件,FPGA现已开端了它在数据中心范畴的广泛运用。除了像微软、亚马逊这样的大型云效劳供给商之外,FPGA也逐步开端进入其他类型和规划的数据中心,并在大数据处理、AI、网络功用加快等范畴扮演者重要的角五八同城,从芯片到系统:FPGA加快卡的展开进程与展望,物美超市色。

(图片来自英特尔)

在这些根据大数据浪潮的全新运用中,FPGA厂商也在不断的探究和测验新的FPGA推行办法。他们的终究意图十分简略,便是让更多的用户运用自己的FPGA产品。但在这个进程中,咱们可非洲裸女五八同城,从芯片到系统:FPGA加快卡的展开进程与展望,物美超市以发现一个重要的展开趋势,那便是FPGA厂商正在逐步的从单纯的芯片供给商,转变为系统级解决计划供给商

回忆曩昔,在传统的FPGA事务模型里,FPGA厂商一般只担任卖给savebt客户两样东西:一个是FPGA芯片,别的一个是FPGA的开发工具。两件东西一旦售出,客户开发何种运用就与厂商无关。尽管厂商也会供给翔实的技能支撑,但首要的开发进程往往仍是由客户完结。

曹蒹葭怎样死的

现在,FPGA厂商更倾向于供给给客户一个完好的系统级解决计划。两大FPGA厂商英特尔和赛灵思现在纷繁推出的各类FPGA加快卡,便是这个趋势的典型代表。

整体而言,FPGA厂商在硬件层面现已不单单供给芯片级的产品,而是进一步供给板卡级的菲特云会员办理系统产品组合。与开发板不同,FPGA加快卡是针对特定范畴和运用的专业板卡,一般以PCIe扩展卡的方法进行布置。板卡上规划有丰厚的高速I/O接口与存储资源,但往往不会装备太多开发板上常见的调试功用与资源,例如通用I/O等。

在软件层面,FPGA厂商除了供给传统的开发套件之外,现在还会供给与FPGA加快卡配套的驱动、各类软件库、编程接口(API),乃至还有下文会说到的完好的软件开发栈以及软硬件参阅规划。

经过供给这些完好的开发环境,大大简化了FPGA的开发难度,使得软件开发人员也能在短时刻内完结算法模型的FPGA完成。FPGA厂商的首要意图,是在不断供给原厂软硬件解决计划的一起,也在不断吸收第三方的IP与运用,然后构建一个完好的FPGA生态系统

一起咱们也注意到,除了FPGA原厂的加快卡计划之外,许多第三方厂家,比方华为、浪潮和Mellanox等,也相继推出了各自的FPGA加快卡产品。这些第三方加快卡尽管选用的都是英特尔或赛灵思的FPGA芯片,但都针对各自的细分范畴做了优化规划,以习惯方针运用的需求。

鄙人文中,我将具体介绍一下其时在商场上首要的FPGA加快卡产品,以及各个厂商根据加快卡的FPGA生态系统布局。

英特尔的FPGA加快卡布局

早在2017年10月,英特尔就官宣了旗下的首款FPGA加快卡产品,名为“Programmable Acceleration Card”,简称PAC。一起发布的,还有与之配套的软硬件开发结构与加快栈系统。这不仅是英特尔FPGA的首款通用FPGA加快卡产品,也是其时商场上的首款面向大数据、AI、高新能核算等新式范畴的数据中心FPGA加快卡,因而PAC的含义非同寻常。

(图片来自英特尔)

在硬件规范方面,PAC运用了英特尔的Arria10 GX FPGA,它根据英特尔的20纳米工艺制作,具有115万个可编程逻辑单元,是其时功用和容量最强壮的英特尔FPGA。PAC集成了8GB的DDR4内存和128MB闪存,有一个QSFP+接口艾彼手表,能满意最高40Gbps的网络衔接带宽,一起有PCIe Gen3 x8接口与主机CPU互联。

(图片来自英特尔)

值得注意的是,PAC的板级功耗约为45W~60W,因而得以选用了被迫散热规划,然后将五八同城,从芯片到系统:FPGA加快卡的展开进程与展望,物美超市板卡的尺度操控在了半高半长,方便在各类效劳器的布置。

PAC的首要运用场景是加快数据中心的各类运用,作为英特尔的原厂产品,PAC在数据中心里有着得天独厚的优势。它天然生成可以作为英特尔Xeon处理器的硬件加快单元,用于卸载和加快原本在CPU上完成的各类运用,然后构成英特尔CPU+FPGA的高功用数据处理组合。

作为生态系统构建的重要组成部分,英特尔还发布了面向Xeon和FPGA的加快仓库(Acceleration Stack),见下图。这个加快仓库本质上是一个软件开发结构,包括了FPGA板卡的驱动、API、接口办理、软件库与开发工具等,然后为CPU与FPGA的联合开发供给了通用的编程接口,简化了开发流程,缩短了开发时刻。

(图片来自英特尔)

为了向软件开发者进一步笼统底层的FPGA硬件资源,英特尔开源了名为“敞开孟繁茁可编程加快引擎(Open Programmable Acceleration E膏壤英魂ngine - OPAE)”的技能。OPAE是一个层次化模型,供给了一系列规范的软件接口,以及常见硬件功用的FPGA完成,比方各类寄存器与内存分配逻辑等等。一起,也供给了许多操作系统内核空间的FPGA支撑,使得和高兴在一起舞蹈视频开发者可以专心于用户空间的运用开发。

(图片来自英特尔)

PAC发布一年后,英特尔在2018年10月发布了另一款根据Statix10五八同城,从芯片到系统:FPGA加快卡的展开进程与展望,物美超市 SX FPGA的加快卡。比较前一代产品,这款加快卡在硬件功用上有了质的飞越。Stratix10作为英特尔的高端FPGA系列,根据英特尔的14纳米工艺制作,并选用了广州大学数字广阔3D系统级封装技能,有着更高的集成度。在这款PAC选用的Stratix1乳胶紧身衣0 FPGA上,有280万可编程逻辑单元,244Mb片上内存以及高达26Gbps的串行收发器。

(图片来自英特尔)

板上资源方面,这款PAC包括32GB DDR4内存、两个最高支撑100Gbps网络带宽的QSFP28接口,以及PCIe Gen3 x16接口。因为这个板卡面向更高功用的数据中心运用,因而在功耗和尺度方面都有所增加,其间板级功耗约为225W,尺度为全高、3/4长的双槽规划。

(图片来自英特尔)

在2019年MWC大会的第一天,英特尔又推出了一款针对5G运用的FPGA加快卡PAC N3000,见下图。这款加快卡可以完成高达100Gbps的网络流量的加快处理,一起支撑9GB DDR4和144MB QDR IV板上内存。

(图片来自英特尔)

关于英特尔的FPGA加快卡产品而言,它们最大的优势之一便是英特尔在数据中心处理器范畴的中心分配位置。因为英特尔Xeon处理器占有了数据中心商场的x86处理器的绝大部分商场份额,因而不管何家的FPGA加快卡都必须针对Xeon处理器做许多的兼容性规划和优化,而谢铁骅英特尔FPGA在这方面有着先天的血五八同城,从芯片到系统:FPGA加快卡的展开进程与展望,物美超市统优势。这也使得英特尔成为现在仅有一个可以供给全栈式数据中心解决计划的公司。

此外,英特尔与各大效劳器制作商保持着杰出的合作关系,因而包括戴尔、HPE、富士通等效劳器制作商会很天然的在自家的效劳器产品中参加并出售根据英特尔FPGA的加快卡。但是,这关于其他FPGA厂商而言就没有那么瓜熟蒂落,他们往往很难压服效劳器厂商或许客户在现已内置了FPGA的效劳器中,再花费额定的本钱,并冒着兼容性的危险去增加其他的FPGA加快器。

赛灵思的FPGA加快卡布局

赛灵思的FPGA加快卡产品起步相对较晚。在2018年10月,赛灵思才正式发布了旗下首款面向数据中心运用加快的FPGA加快卡产品,名为Alveo。第一批推出的Alveo U200和U250板卡均根据赛灵思的16纳米UltraScale FPGA器材,别离具有89.2万和134.1万个可编程逻辑单元。在FPGA器材方面,这两款Alveo卡与英特尔的PAC比较,可以说在伯仲之间。

这两款板卡首要针对的都是大型数据中心运用,因而板上集成了64GB DDR4内存,孙光骏违规以及两个QSFP28网络接口和一个PCIe Gen3接口。与PAC比较,这两款板卡的板级资源要丰厚的多。但是,这也导致Alveo板卡的外形尺度和功耗都比较大。当选用自动散水事易热时,板卡尺度为全高全长,规范功耗为100瓦~110瓦,功耗峰值可达225W,远超过PAC的45W~60W。

(图片来自赛灵思)

在生态系统建造方面, Alveo加快卡将首要根据赛灵思的SDAccel软件进行开发。SDAccel是一个集成的开发环境,它tingles的首要结构层次如下图所示。

SDAccel最首要的特色之一是包括针对比方C/C++和OpenCL等高层次言语的FPGA编译器、软件库和API等根底架构,以期协助软件开发者更快的对FPGA硬件进行开发。这一点,与英特尔的面向Xeon和FPGA的加快仓库有异曲同工之妙。这也印证了其时FPGA软件系统展开的趋势,便是需求不断下降FPGA开发的门槛,经过尽量多的供给高层次言语的支撑,以进步FPGA的开发功率,缩短产品问世时刻

(图片来自赛灵思)

第三方的FPGA加快卡

除了英特尔和赛灵思推出的原厂FPGA加快卡之外,许多第三方厂商也在近年相继推出了根据FPGA的硬件加快卡产品。其间比较典型的有我国浪潮、华为等公司推出的加快卡,以及国外Me五八同城,从芯片到系统:FPGA加快卡的展开进程与展望,物美超市llanox公司推出的根据FPGA的智能网卡产品。

浪潮的F10A FPGA加快卡是现在在售的一款FPGA加快卡产品,见下图。它选用了英特尔Arria10 FPGA,最多包括115万个片上可编程逻辑单元。加快卡上供给了两个SFP+ 10Gbps以太网端口,PCIe Gen3x8接口,以及最高32GB板载DDR内存。

(图片来自浪潮)

在2018年10月底的赛灵思开发者大会上,浪潮和华为都发布了自己的新FPGA加快卡产品,别离叫做浪潮F37X和华为FX系列,如下图所示。

(图片来自浪潮)

(图片来自华为)

这两款加快卡都选用了赛灵思的16纳米UltraScale+ FPGA器材。比较赛灵思的原厂Alveo加快卡,这两款加快卡产品的首要特色是功耗得到了进一步减少,这或许得益于FPGA芯片规范的进步。例如,浪潮的F37X加快卡的典型功耗只需75瓦左右,而华为的FX系列的中端加快卡的典型功耗最大为75瓦,高端卡为200瓦。

在其他技能规范方面,浪潮F37X加快卡运用的FPGA集成了8GB的HBM2片上高速缓存,比较DDR而言,能大幅进步存储带宽和访存功率。比较Alveo,新推出的这两类第三方加快卡都有着更高的片上逻辑单元数量,足以应对各种新式的数据中心核算与运用场景,比五八同城,从芯片到系统:FPGA加快卡的展开进程与展望,物美超市如机器学习、碧海雅韵视频编解码、NFV、图画与语音辨认等等。

老石在之前的文章《Mellanox为何让多家巨子公司趋之若鹜》中介绍过,Mellanox是一家总部坐落以色列的闻名的网络设备供货商,旗下产品包括网络操控芯片、网卡、线缆、交流机、软件等等,可以说简直涵盖了数据中心网络产品的各大类别。Mellanox的根据FPGA的智能网卡产品名为Innova-2 Flex,见下图。

(图片来自Mellanox)

这款智能网卡上包括两个首要芯片,一个是Mellanox的ConnectX-5以太网操控器,另一个是Xilinx的Kintex UntraScale FPGA。板上包括两个25G以太网端口,都与ConnectX-5相连,然后再经过PCIe Switch衔接Host和FPG带鱼孩子刷爆网络A。ConnectX-5自身就可以完成不少硬件加快功用,比方常见的虚拟交流、SRIOV、QoS与流量操控等。因而FPGA在这个卡上更像是一个“辅佐”的加快单元,首要的规划意图是用来完成和加快各种CPU上不支撑、或功用较低的定制化需求。

结语

在今日,FPGA厂商现已从单纯供给FPGA芯片和底层开发工具,逐步转变成供给根据FPGA加快卡和完好软件倒挂姐开发环境的全栈式解决计划。一起,第三方FPGA加快卡的呈现,也极大的丰厚了FPGA加快卡产品的可选择性,以针对不同运用场景下的用户需求。

这些转宋辞遇苏惜变背面的首要动力,便是其时FPGA在许多范畴的广泛而深化的运用。只需捉鬼之超级天师FPGA还能不断推进AI和大数据年代的展开,这个趋势就会持续前行。

实时 专业 原创 深度

英特尔 规划 开发
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。
文章版权及转载声明:

作者:admin本文地址:http://www.cnschoolnews.com.cn/articles/482.html发布于 5个月前 ( 03-29 06:32 )
文章转载或复制请以超链接形式并注明出处竞技宝官网_竞技宝官网下载_竞技宝官网下载安装