众所周知,金融行业每天都要处理大量数据并进行即时交易。对于这样的交易而言说,低时延是降低成本和获得利润的关键。但是,这种高频交易对算法和硬件提出很高的要求,可以说,毫微秒之间的延迟就可能导致数百万美元的亏损。
巨额的市场数据传输也是影响交易速度的因素。通常高频交易都需要在交易所租用、托管或者在交易所附近部署服务器的方式来获得速度优势。但交易所有限的空间限制了承载服务器的数量,高频交易还面临监管合规需求,对算法也提出严格的挑战。
AMD的CPU产品,包括EPYC、Ryzen以及FPGA加速卡,一直在高效、安全地执行交易,化解金融行业的急迫需求。而前不久发布的全新的Alveo UL3422加速卡,更是为金融行业提供了超低时延电子交易应用的解决方案。
与上一代Alveo UL3524产品相比,Alveo UL3422以更小的尺寸节省空间、能耗和成本,并且与多数服务器兼容,实现了性能与性价比之间的出色平衡。
“新推出的Alveo UL3422金融科技加速卡能够实现FPGA加速,在超低时延的基础上实现硬件的自试验,以纳秒级的速度实现非常迅速的tick-to-trade全球交易”。负责AMD加速卡产品组合的硬件战略、路线图规划的AMD自适应和嵌入式计算事业部高级产品线经理Shyam Chander对Alveo UL3422金融科技加速卡的特征和性能进行了详细解读。
详解Alveo UL3422金融科技加速卡
Alveo UL3422金融科技加速卡采用带有GTF收发器的的芯片,完全满足实现超低时延交易执行要求。GTF是专为超低时延市场基于Virtex UltraScale+ VU2P FPGA芯片开发的一款收发器,在Alveo UL3422及上一代的Alveo UL3524上都已采用。与前一代GTY相比性能提升约7倍性能,时延降低40%到49%(相当于13.9纳秒)。
除了能够实现超低时延的金融交易,Alveo UL3422由于精简了功能集,减少了端口,全高半长的尺寸规格更适合交易所主机托管且费用大为降低,支持几乎所有的x86服务器,降低了使用门槛,完成实时的数据送达和交易执行。如若用于2U和4U服务器配置,只需增加卡的数量。
传统的FPGA开发者通过使用非常熟悉的FPGA的工具流程,借助AMD的Vivado设计套件进行RTL设计,针对时延基准测试推出参考的设计,评估时延,集成自定义的算法,可支持高频交易的公司不断优化其交易策略,适应不断演进的交易、算法和监管的要求。
AMD还提供了非常丰富的IP工具包和生态系统的解决方案,可以迅速地部署。无论是采用IP还是其他解决方案,都能够预构建的基础设施IP,实现超低时延,运行时堆栈和API也简化了开发。另外还可以适用于工业标准的框架,FPGA用机器学习开发框架实现低时延,比如使用FINN的编译器。它还支持PyTorch开发和神经网络量化、FINN编译及生成RTL IP。
把人工智能加到交易上已经成为趋势。传统的金融科技领域其实并没有应用人工智能,也就是说,机器学习不是交易的一部分,但技术的发展迫使机器学习监督以及机器学习的引擎加入到交易中。FPGA在这个过程中有什么样的优势?Shyam认为主要是两个方面:首先,FPGA是可以编程的,所以它能够适应各种各样的算法,或者要实现利润的最大化,通过FPGA来实现可编程的无缝的连接,另外,金融科技对于超低时延有非常严格的要求,FPGA通过GTF收发器可以实现20纳秒之内的数据传输,从而满足超低时延的要求。
Alveo UL3422还有两个网络端口,分别是连接10G和25G的规格,支持FPGA的相关操作。另外,应对金融服务对于时效性和准确性的高要求,Alveo UL3422也能够实现和外部单元的交互,确保获得精准的时间戳记。
Alveo UL3422加速卡支持算法和交易,其算法支持交易前的风险检测,减少错误的发生并且更好地满足合规要求,FPGA和DSP加速执行客户的交易策略,内置的DDR4 RAM可以存储订单簿信息和历史定价的数据,实现内存的迅速访问和存储。
UL系列加速卡在市场上一直保持领先地位,Alveo UL3422加速卡的推出,又扩大了AMD在市场上的领先优势。
解决方案支持所有各类交易场景
Shyam展示了AMD如何应对各种算法交易用例。他指出,在所有的这些用例当中,速度都是非常关键的,算法也比较复杂。无论何种场景,AMD的解决方案都能圆满应对,支持得金融机构在市场上立于不败之地。
低于20纳秒的超低时延。这一类交易针对的是做市商和套利,其特点是求快,使用的数据量最低,算法也较为简单。Alveo UL3422以及Alveo UL3524可以满足这个领域的需求。
低于100纳秒时延的交易。这类交易对时延要求有所放松,算法复杂程度有所提高,数据量相对更大,支持更加深层次的历史模型的分析。从计算到内存的资源方面,Alveo V80 FPGA和自适应的SoC完全适配,较好地满足要求。
CPU交易。这是最传统的交易方式,其速度是低于1000纳秒,处理过程中数据主要是通过CPU的主机来进行处理和计算,数据传输通过NIC来实现。AMD 以Alveo X3522来支持这些低时延的CPU交易,EPYC甚至Ryzen处理器也都能够满足相关的工作负载和用例。
除了电子交易之外,Alveo UL3422加速卡在低时延相关的其他领域也有应用。在科研活动中,很多数据馈送的处理需要在交换机中来完成,若有一个交换机能够实现超低时延,也是非常重要的,而且确实需要这样超低时延的芯片能力。MD也看到了这样的趋势。
Alveo UL3422,以性价比优势服务全球市场
Alveo UL3422金融科技加速卡支持超低时延的交易执行,网络I/O的传输可以支持最快的交易反应速度。由于纤薄尺寸规格,极具性价比的部署,Alveo UL3422能够降低进入门槛,实现广泛采用,最终实现轻松的开发和快速的交易,参考设计、工具与生态系统的IP都已经推出,而且这款产品已经在量产中,将很快供应给用户。
Shyam总结说,“AMD提供了非常广泛的产品组合来支持全球的市场,包括金融科技领域的客户,也支持数据中心应用。“