数据大爆炸、智能要互联,菲数科技要以“FPGA+云"助力高性能计算

用AI防鲨鱼、用AI学写中国书法、用AI预测人类死亡时间、用AI审判罪犯……在人工智能方兴未艾的今天,越来越廉价和普及的AI领域真的是什么都不值钱,除了想象力。那在这无所不能的AI盛世,一定没道理让算力限制我们的想象力,更没道理让算力限制了我们的生产力。

从CPU到CPU+,从+GPU到+FPGA

随着通用处理器(CPU)的摩尔定律已入暮年,从美国的微软、亚马逊到中国的BAT、华为,几乎所有的互联网巨头们都在补充他们的标准服务器芯片——CPU,使用可替代的硅来追赶在人工智能领域的急速变化。2012年,微软开始将支撑了通讯行业二十年高速发展的可编程芯片,即FPGA用在其搜索业务——Bings上,且公布FPGA相比于CPU在处理Bing 的自定义算法时快出40倍,整个系统比Bing 现有的系统快出两倍,因此其可以将当前已经投入使用的服务器数量减少一半。甚至在接下来的几年里,几乎任何一个新的微软服务都会包含一个FPGA。

那么这个所谓的可编程芯片到底是什么?据菲数科技创始人兼CEO王文华介绍,2017年是全球超大规模数据中心的“爆发年”,全年新增超大规模数据中心90余个,总数量超过390个。且2018年也没有丝毫放缓的迹象。如此海量数据需要计算机高速计算各种矩阵运算、图像处理、机器学习、压缩、非对称加密、搜索排序等。即数据中心优先于人工智能发展,这一点也得到了目前在FPGA领域一枝独秀的赛灵思的支持。今年3月,其新上任的CEO Victor Peng在采访中表示,赛灵思已经把数据中心优先放在其三大战略重点的首位。

而传统计算机中无论是CPU,还是作为协处理器的GPU ,都属于冯•诺依曼结构,即指令译码执行、共享内存。但由于指令流的控制逻辑复杂,不可能有太多条独立的指令流。为每一个新问题开发专用的芯片又成本过高,因此,这对硬件算力的性能存在着极大的挑战。

在以通用处理器计算和特定目的的协处理器计算混合异构工作中,作为有着更加高效的数据处理能力和基础架构的FPGA,则延续了以“CPU+GPU”的第一代异构计算,形成了“CPU+FPGA”的第二代异构计算。其逻辑是在每一个服务器与基础网络连接的地方部署可编程芯片,在数据到达服务器之前提前一步处理它们。

FPGA+云VS FPGA+端,C端市场VS数据中心

自成立起便定位于异构计算领域的菲数科技,也是国内最早一批专注于云端异构加速、高性能计算的创业公司,其CEO王文华表示,看好FPGA在异构领域的发展主要是基于以下几个原因。

首先,FPGA 之所以比 CPU 甚至 GPU 能效高,本质上是无指令、无需共享内存的体系结构带来的福利。其每个逻辑单元的功能在重编程时就已经确定,不需要指令;其次,对比GPU几乎只有的数据并行,FPGA则同时拥有流水线并行和数据并行,可以根据处理数据包的步骤搭建出不同流水线,在GPU的计算单元都按照统一步调做相同事情时,FPGA早就已经分散的处理完了;而即使是吞吐量、延迟和功耗三方面都可一战的ASIC专用芯片,FPGA也因其可以快速更新逻辑、可编程的万能部署、保持不同服务器不同加速卡的同构性等优势,解决了前者研发成本高、周期长等问题,在瞬息万变的人工智能领域减少了投资风险。

比起目前业内为数不多叫得上名字的创企,如深鉴、地平线等将FPGA的业务应用在端,即偏向C端的市场化,菲数科技的业务重心则在是FPGA+云,专注于数据中心的异构加速解决方案,产品形态包括硬件加速板卡和FPGA加速IP。除了以单个产品切入数据中心的大型B端企业外,菲数已经形成了从硬件板卡,FPGA IP方案到用户API的完整产品方案。

对此,王文华解释到,C端市场与数据中心是完全不同的市场,虽然都采用FPGA进行加速,数据中心更多的是关注性能,而C端更多的是关注功耗和成本。因此,FPGA在广阔的C端市场面临着众多ASIC解决方案的激烈竞争,而在数据中心则具有独特的优势。

首先,FPGA丰富的互联接口既适应于数据中心多样性的业务,也适应于新硬件的引入,如ssd硬盘或是HBM内存等等,具有良好的拓展性;同时它的可重构性,也使得它可以在相同的硬件上实现不同的加速功能。这让其很好的避免了因业务方向发生变化而被淘汰的情况,减少硬件投资试错成本;其次,FPGA不需要指令,稳定而又极低的延迟,也适用于流式的计算密集型任务和通信密集型任务;再次,CPU+FPGA的异构模式,既可以保持数据中心的硬件同构性,同时又具有实现软件定义的能力。

当然,随着人工智能在端上的下沉应用,对端的计算性能要求也会逐渐向云端的性能靠齐,因而FPGA在复杂的端设备的应用上(譬如辅助驾驶、机器人、智能摄像头等等)也会逐步推广。

 

芯片国产化进程步履维艰?新兴创企征战蓝海市场

事实上,在与通讯基础网络的连接上,由于FPGA天然的通讯基因,更是明显优于其它竞争对手。这种架构上的优势使其定位并不是某种硬件的替代品,甚至将带来整个行业的革命。

而此前Grand View Research的分析,2015年全球FPGA总市场规模达 63.6 亿美元,预计到2024年将达到142亿美元。目前全球玩家都屈指可数的赛道无疑是个新蓝海。且由于技术驱动发展,根据此前巨头的布局时间和周期,以及菲数即将推出的新产品,目前处于培育期的FPGA异构加速市场极有可能在2019年年初迎来爆发性增长。

除了对市场方向的坚定,还有自身的专业。菲数科技的核心创始团队全部来自FPGA领域巨头企业资深人员。创始人兼董事长徐卫根,浙江大学MBA,原UTStarcom研发副总裁,20年+管理及运营经验;创始人兼CEO王文华,浙江大学硕士,15年+研发管理经验;技术团队接近二十人,分别来自美国中国名校、多有UT、华为、诺西等公司多年相关研发经验。

作为国内最早一批专注于云端异构加速,高性能计算的创业公司之一,菲数科技在成立之初即与IBM展开合作,2016年成为OpenPOWER成员;2017年10月成为阿里云异构计算生态共建的合作伙伴之一;其加速板卡的规格,功能以及完善的技术支持已经获得市场的认可,成为目前的主流产品。

未来在推出人工智能加速平台1.0后,将会进一步的实现FPGA异构加速的虚拟化和云化,进一步深耕数据中心异构加速蓝海市场。

中国本土综合实力最强大的大型IT企业之一,同时也是菲数科技的合作伙伴的浪潮集团,其高效能服务器和存储技术国家重点实验室陈继承博士表示,此前GPU赶上了计算数据结构大量调整的好时代,而用硬件适配软件、且每种软件都是最优适配方式的FPGA也显然是下一个爆发点。在目前还未系统建立生态、相对空白的市场中,如何将成千上万FPGA资源池化实现统一部署、动态重构和如何将单个FPGA虚拟化,实现细粒度资源优化利用进而实现FPGA异构计算的真正落地,是创业公司的重大机遇和挑战。

另外,浪潮科技作为该领域老牌巨头,陈继承也见证了FPGA在云计算领域的发展,关于对菲数团队的看好,其解释到,在芯片国产化进程的今天,创业公司不仅限制较少、也更为热情,且对比美国科技产业化,方向对、热情够的新兴创企,成果能更快的被市场认可。

2017年3月,菲数科技曾获得由中科创星领投的千万级天使轮融资,目前正在进行1500万—2500万的A轮融资,主要用于人员扩充、产品量产、技术研发、业务开拓等。值得一提的是,此前菲数科技已申请4项中国发明专利,一项美国发明专利。尽管赛道因为市场红利期未到使这个高壁垒的行业玩家多专注在技术上,但从各家创企在知识产权的结果来看似乎并没有太垂直的成就。这也让菲数科技深耕在技术领域的专利更具价值。

万物互联的时代,数据中心的云化是未来的趋势。独立的、单机模式的异构加速必然要被以FPGA为主体的池化模式所替代。随着FPGA在数据中心方向的逐步发力,以及相关生态的逐步改善,FPGA成为数据中心的主流硬件平台,则是一个正在逐步变成现实的趋势。