Intel 的 FPGA 数据中心玩法

EEWORLD

电子资讯 犀利解读

技术干货 每日更新

数据中心的新时代

正如当初 2015 年 Intel 以 167 亿美元收购 Altera 时所承诺的,会给数据中心带来突破,2018 年 4 月 12 日,新的Intel可编程逻辑部门交出了一份引人注目的答卷,而且是以一种 100% 的 Intel style——携手 OEM 合作伙伴。戴尔和富士通宣布在其服务器中采用 Intel 的基于 Arria 10 GX FPGA 的可编程加速卡(PAC)。

Intel 可编程解决方案事业部亚太区市场拓展经理刘斌

“我们希望后续还会有其他主流的 OEM 厂商向大家做这样的公布,请拭目以待,应该会非常快”, Intel可编程解决方案事业部亚太区市场拓展经理刘斌说。显然 OEM 伙伴的纷纷支持,是 FPGA 在数据中心的加速成为主流应用的重要条件。

事实上,这种变化正是人们预料中的。数据大爆发的时代导致计算力的瓶颈,使得异构计算成为必然,虽然 GPU 和 FPGA 被认为在不同的应用场景下各有千秋,但 GPU 的缺点在于延迟大、能耗比低、成本较高,低延迟性是 FPGA 天然的优势,加之运营成本较低,所以 CPU+FPGA 的组合一直被人们期待在数据中心的舞台上一展身手。当初微软在其数据中心大规模使用 FPGA 支持 Bing 时曾引发热议,而现在人们已经认可 FPGA 将在数据中心扮演重要角色。

其实在 Intel 之前,已有用户自己用 FPGA 构建硬件系统来做加速,一些第三方也在开发 FPGA 加速卡,但是当 Intel 自己亲自做的时候是在向市场释放一种信号:这是一个重要方向,同时也是在给用户信心,当你真的要进行部署的时候市场上有高质量、大规模供货、有售后保障、拥有整个产品生命周期管理的产品可供选择。

对手

好的机会大家都能看到。从 2000 年互联网泡沫时至今,FPGA 的市场总量始终维持在 50 亿美元左右,虽然被更多地采用。但架不住价格直线下滑,即使直到今天 FPGA 在人们心目中还是“昂贵”的印象。虽说通讯现在依然是 FPGA 最大的市场,但人们期待着一个变化的发生,一个比通讯更大的市场——数据中心。

就在一个月之前,Xilinx 的新 CEO Victor Peng 宣布将下重注在新的架构——ACAP(Adaptive Compute Acceleration Platform,自适应计算加速)平台,并直呼“Data Center First(数据中心最重要)”。据其新闻稿,ACAP 是一个高度集成的多核异构计算平台,其核心是新一代的 FPGA 架构,结合了分布式存储器与硬件可编程的 DSP 模块、一个多核 SoC 以及一个或多个软件可编程且同时又具备硬件自适应性的计算引擎。新闻稿上充满了“颠覆”、“革命性”这样的词汇,其“Everest(珠穆朗玛峰)”的代号也充分表明了 Xilinx 在这个 7nm 芯片上寄予的雄心与梦想。

但 ACAP 最终是否真能如 Xilinx 所宣传的那样,还需等到芯片出来后方见分晓。首款“Everest”产品将于 2018 年实现流片,2019 年交付给客户。大家都明白,marketing 是 marketing 的语言,technical 是 technical 的语言。历史上的 Xilinx 和 Altera 就曾乐此不疲地在新闻稿上通过巧妙用词来“领先”对方。

Intel 是认真的

面对对手的咄咄逼人,Intel 会如何处置?“这还是一片很蓝的海”,刘斌的一句话轻松地提高了境界,“大家还在想办法解决用户的问题,现在要帮助用户尽可能快地加速各种新业务的发展。所以在这里面,我们觉得每一家都应该发挥自己最强的实力,我们把自己的事情做好,当然 Intel 真正的实力在于有这么长期的在计算领域里面的积累。”

众所周知 Intel 的过人之处在于构建出了强大到不可超越的生态系统,而这正是 FPGA 的软肋,其开发周期和门槛一直为人所诟病。目前全中国可以用 FPGA 进行开发的工程师不过区区 3 万人,而且还集中在通讯领域那几家大公司。改变这一切需要生态系统,原来无论 Altera 还是 Xilinx 都看到了这一点,但却无力去做。如今的 Intel 试图改变。

加速堆栈已可以在 Intel 官网下载

2017 年,Intel 推出了面向 Intel 至强 CPU 和 FPGA 的加速堆栈,将一些通用功能集成在里面,该软件站的API接口部分是开源的,既支持 FPGA 传统的 RTL 语言,也支持 OpenCL 高阶语言,同时还在考虑 C++。加速堆栈可以使用户节省开发成本和时间,将精力放在更具商业价值的应用开发上,同时也能让整个生态系统中的合作伙伴可以较好地在不同平台上进行移植,之前 FPGA 领域没有标准的加速卡或软件应用访问接口,导致各公司开发的东西相互之间不互通。Intel 这么做即是希望有更多的人可以参与到加速堆栈的发展过程中,慢慢建立起面向 FPGA 加速的开发者社区,从而逐步拓展生态环境。

在发布产品之外 Intel 还做了一件非常重要的事,就是邀请各种不同类型的合作伙伴,其中既有 FPGA 加速器的硬件开发伙伴,也包括系统集成商和软件应用集成商,大家一起形成合力去支持不同垂直领域的加速方案的建设。刘斌展示了两个使用 Intel FPGA 可编程加速卡的应用案例。

一家名为 Levyx 的公司为金融机构打造的财务风险分析系统,基于自身的测试得到的结果是,在一个具体的执行算法加速的位置上得到了 850% 的加速,而把整个流程执行完、算完损益值之后的端到端的加速大于 2 倍。在这个垂直市场的模型之外,还有一个应用面更广泛的的数据库案例,该领域面临的挑战在于:不同类型的数据库并存、数据的存储方式多样,而这样的高复杂度造成查询极其耗时与用户实时性要求高的矛盾。FPGA 可以在查询指令进行转化、数据分析这两个点上进行加速。Swarm64 公司提供的解决方案在数据分析这个点可达到平均 20 倍以上的加速能力,从端到端的角度来看,在数据仓储和压缩上面分别提供 2 倍和 3 倍以上的加速。

刘斌着意强调这两个例子并不代表全部,Intel 在全球已经邀请了几十家类似的合作伙伴一起来帮助 Intel 开发不同领域的完整的 FPGA 加速解决方案,主要集中在数据分析、人工智能、视频转码、网络安全、金融加速以及基因研究这六大领域,未来 Intel 将逐步在用户端向大家进行展示。

红海 or 蓝海?

之所以对生态系统大力发展,Intel 无疑非常清楚,在数据中心加速应用上的各种计算模式的竞逐中,性能的比拼只占一部分,关键还是在于对行业方向的理解和对客户业务需求的把握。GPU 之前用几年时间做起了一个已被接受的生态系统,FPGA 要想在数据中心站稳脚跟,必须加速这个进程。众多的 OEM 设备商、应用软件开发商、系统集成商们都将被一起裹挟进来。这场竞争中的商业语言将不是这块 FPGA 加速卡上有几个接口、多少逻辑单元、价格几何,而是客户的商业模式是什么、需要帮客户解决什么样的问题、需要用什么样的解决方案。

Intel 邀请合作伙伴在六大领域开发解决方案

无论对于 Intel 还是 Xilinx,考验的同样都是构造生态系统的能力。做生态原本是 Intel 传统的强项,此次的发布就再现了那种每当英特尔发布新的处理器时,总会拉着一群小伙伴们站台的模式。而另一个不可忽视的则是 Intel X86 服务器目前在数据中心的占有率,虽然各家数据不一,但 96% 这个数字是大家基本上认可的。换句话说,数据中心更像 Intel 自家的后院,延续这样的优势似乎顺理成章,绝对不应允许别人染指。

Intel 和 Xilinx 究竟谁会在数据中心这条路上跑得更远?看上去这场竞争似乎并不对等,Intel 和 Xilinx 和对决,绝不同于 Altera 和 Xilinx 的对决,所谓细思极恐。刘斌就告诉 EEWorld 记者,在 Altera 时代,得到戴尔、富士通这样的顶级服务器供应商的鼎力支持是不敢想的。因为对于他们而言,接受一个 FPGA 厂商把产品布署在自己的服务器里并不是那么容易,而且验证也需要大笔资金。看上去似乎天平倒向 Intel 一连,但历史上 Intel 并非没有败绩,敌人永远是 Intel 自己。我们看到 Intel 还收购了 Nervana,一家做 GPU 的公司,Intel 是否还在三心二意?加之 Intel 之前的收购史并不怎么样,所以其实最终还是要看Intel自己做这件事的决心。此外还存在的一个变数是,如果 Xilinx 如之前传闻的那样也被收购,玩法又变了。

今年恰逢英特尔成立 50 周年,从 1968 年到 2018 年,这位 50 岁的芯片巨人还是在兴致勃勃地寻求各种机会。他宣称数据是未来的石油,数据的价值和怎样挖掘它的潜力才是未来推动整个产业转型、实体经济发展的重要原动力。作为一家一直处理数据的公司,Intel 几十年来每天都在关注数据,Intel 给客户提供数据的价值不只是获得或存储,重要的是如何将其变成用户可以进行下一步决策的信息。我们相信数据中心市场在 Intel 具有战略地位。

一切才刚刚开始,大戏刚刚拉开序幕。

(0)

相关推荐