不愧是云计算大哥大!亚马逊云科技一口气发布六款大模型,3nm AI芯片,Any-to-Any突破传统

引言

【算力豹导读】云计算大哥大“亮家底”,算力革命即将到来!

在年度云计算领域的巅峰盛会AWS re:Invent大会上,亚马逊云科技(AWS)震撼登场,一举推出了6款全新大模型,并预告了即将问世的2款大模型,同时亮出了其科技利器——3nm制程的第三代AI训练芯片Trainium3,以及迄今为止性能最为强悍的AI服务器Trn2 UltraServer。此番举动标志着Amazon Nova系列基础模型的华丽首秀。

这一系列模型涵盖了Micro、Lite、Pro、Premier四大版本的语言模型,每一款都各具特色,满足不同场景下的应用需求。此外,还有令人瞩目的图像生成模型Canvas以及视频生成模型Reel惊艳亮相。特别是Reel,目前已能流畅生成6秒视频,而未来不久,其生成时长将拓展至2分钟,为用户带来前所未有的视觉盛宴。

风云变幻的生成式AI时代

在即将登台发表演讲之际,亚马逊云科技新任首席执行官Matt Garman提出了一个引人深思的见解:人工智能是一场永无止境的竞赛,它将会持续不断地向前推进。

目前,这场竞赛尚处于初期阶段。在经历了“全力投入大模型”的狂热之后,业界开始深思:在这场持久战中,接下来应把重点放在“细水长流”的稳健发展上。

对于各行各业的用户而言,可持续发展面临的首要挑战便是成本问题。如果说去年我们还在探索如何适应新兴的生成式AI技术,那么到了2024年末,更为关键的是:如何不断降低生成式AI的应用成本,即提高生成式AI技术应用的性价比。

在今日凌晨的主旨演讲中,Matt Garman分享了亚马逊云科技在人工智能和计算等领域取得的“新技术、新产品、新服务”成果,标志着生成式AI技术栈的又一次革新。

我们见证了一系列前沿的技术能力发布,这些发布令人震撼且源源不断。与此同时,技术的落地成本降低到了令人难以置信的水平。

这一系列升级,无疑堪称“真正的革命性变革”。在变幻莫测的生成式AI时代,亚马逊云科技再次展现了其“掌控全场”的实力。

将性价比做到极致

去年4月,亚马逊云科技正式踏入生成式AI大模型的竞技舞台,其首发的Amazon Titan系列模型当时专注于文本内容的生成与高效搜索功能的打造。仅仅一年多时间,亚马逊云科技已在基础模型层面完成了全面布局,正朝着涵盖文本、图像、视频及语音的全模态体系全力迈进,在与OpenAI、谷歌、Anthropic等业界巨头的竞争中,展现出了强劲的实力。

在今年的re:Invent大会上,亚马逊云科技自主研发的生成式AI多模态Amazon Nova系列模型惊艳亮相。该系列模型不仅在多种任务中达到了业界领先的智能水平,更在性价比方面树立了新的标杆。

亚马逊总裁兼CEO安迪·贾西(Andy Jassy)亲自见证了这一重要时刻。此次发布的Amazon Nova系列模型共包含四个版本:

纯文本模型Amazon Nova Micro,支持高达128k的上下文,能够以极低的成本实现最低延迟的响应;

成本效益显著的多模态模型Amazon Nova Lite,支持300k上下文或30分钟视频输入,能够迅速处理图像、视频及文本信息;

功能全面的多模态模型Amazon Nova Pro,同样支持300k上下文或30分钟视频输入,在准确性、速度与成本之间实现了完美平衡,适用于各种复杂任务;

以及性能最为强大的多模态模型Amazon Nova Premier,专为复杂推理任务设计,同时可作为自定义蒸馏模型的最佳教师模型。

在基准测试中,Amazon Nova系列模型展现出了非凡的实力。纯文本模型Amazon Nova Micro在与LLaMa 3.1 8B、Gemini 1.5 Flash-8B等模型的对比中,表现相当甚至更优。其210 tokens/s的输出速度更是业界领先,对于追求快速响应的应用场景而言,无疑是最佳选择。而多模态模型Amazon Nova Lite与Amazon Nova Pro在与OpenAI、谷歌、Anthropic等主流厂商的模型中,也在绝大多数基准测试中表现出色,尤其在处理轻量级任务时,Lite更是以极低的成本提供了卓越的多模态处理能力。

目前,Amazon Nova Micro、Lite、Pro三款模型已正式推出,并集成至Amazon Bedrock平台,支持自定义微调和蒸馏。而Amazon Nova Premier则计划于2025年第一季度面世。在性能全面提升的同时,Amazon Nova系列模型中的Micro、Lite与Pro版本的价格相比Amazon Bedrock中同类别的最强模型,至少降低了75%。这对于那些需要大模型服务、预算有限但又追求模型效果的客户来说,无疑是一个极具吸引力的选择。

此外,在图像与视频生成模型竞争日益激烈的当下,亚马逊云科技也展示了其强大的内容创作实力。独立的图像生成模型Amazon Nova Canvas与视频生成模型Amazon Nova Reel相继亮相:Canvas支持图像的生成与编辑,提供了丰富的配色方案与布局控件;而Reel则能根据关键提示词和参考图像生成6秒视频,并支持用户调整摄像头运动以实现平移、360度旋转和缩放等操作,未来还将支持2分钟视频的生成。

安迪·贾西还预告了另外两款即将推出的Amazon Nova模型:Amazon Nova Speech-to-Speech与Amazon Nova Any-to-Any。前者旨在实现自然、类人的口头交互体验;后者则致力于用同一个模型解决多种任务,包括多模态转换、内容编辑以及AI智能体操作等。这两款模型预计将于2025年第一季度和中期分别面世。

从文本到视频,Amazon Nova系列模型一次性全部上线,并直接对标了最新的技术发展方向。亚马逊云科技自研大模型的进化速度之快,让全场观众都为之震撼。

算力革命即将到来

过去十年,AI行业已达成共识:模型参数量的增长和计算复杂度的提升,离不开强大算力的支持。这一结论可以从两个简单维度来理解:一是向上扩展,即使用更强大的计算机;二是向外扩展,即使用更多的计算机。

然而,在生成式AI时代,由于模型涉及数十亿甚至上千亿的参数,设计、训练和部署这些模型都需要消耗巨大的计算资源。例如,每次训练都需要对海量数据进行复杂的矩阵运算和梯度计算,这对算力基础设施的要求远超以往。

对于希望应用生成式AI的企业而言,要追上OpenAI、谷歌等顶尖公司,就必须购买越来越多的高端芯片和云服务,这导致计算成本显著上升。据Gartner分析,到2025年,随着AI技术基础设施的不断升级,各个云支出领域的增长率都将达到两位数。

当前,核心问题在于如何在算力资源短缺的环境下扩大算力来源,并如何在高昂的计算成本压力下高效利用算力。对此,亚马逊云科技的自研AI芯片Trainium为企业用户提供了一个速度快、能耗低的优质选择。

Trainium是亚马逊云科技自研的AI芯片,自2020年首次推出以来,便因其高效的AI模型训练能力而备受瞩目。在今年的re:Invent大会上,亚马逊云科技宣布Trainium2芯片已全面正式可用,助力行业训练和部署大型语言模型。Trainium2的速度是其上一代产品的四倍,于一年前首次发布。

单个Trainium2驱动的EC2实例配备16个Trainium2芯片,可提供高达20.8 PetaFLOPS的计算性能。在测试中,与其他云服务商的类似产品相比,使用Amazon Bedrock Trn2 EC2实例的Llama 3.1 405B模型在token生成吞吐量上提高了三倍以上。

此外,亚马逊云科技与Anthropic正合作构建一个名为Project Rainier的Trn2 UltraServer集群。生成式AI爆发后,Anthropic大量使用了亚马逊云科技的算力设施,并一直紧追OpenAI。今年11月底,亚马逊宣布向Anthropic追加40亿美元投资,累计投资达80亿美元。基于深厚的合作关系,Anthropic将使用亚马逊云科技的Trainium AI芯片来训练和运行其AI模型。

Project Rainier集群将包含数十万个Trainium2芯片,为Anthropic提供足够的可扩展分布式计算能力,以训练下一代大模型。与Anthropic用于训练当前一代模型的集群相比,新集群的计算能力达到其五倍,并将成为全球最大的AI计算集群。

对于规模更大的万亿级参数LLM,亚马逊发布了第二层Trainium2实例——Trn2 UltraServer,同时提供64个Trainium2芯片用于AI模型训练或推理。它将允许用户超越单个Trn2服务器的限制,提供高达83.2 PetaFLOPS的峰值计算能力。

同时,亚马逊云科技的下一代自研AI芯片Trainium3也在研发中。这是该公司首款采用3nm工艺制造的芯片,性能将是Trainium2的两倍,能耗降低40%,性能可与英伟达的新一代AI芯片相媲美。

首批基于Trainium3的实例预计将于2025年上市。亚马逊云科技表示,搭载Trainium3的UltraServer性能将比搭载Trainium2芯片的UltraServer高出四倍。

在生成式AI技术快速发展的背景下,不断进化的亚马逊云科技为用户提供了一个可靠的“算力”选择。当业界热议“追逐Scaling Law是否还有意义”时,亚马逊云科技的Trainium系列和其一整套AI基础设施,无疑为各行各业的用户在这场技术浪潮中提供了坚实的“船桨”。

Any-to-Any万能模型

亚马逊云科技在大会上还推出了任意转任意(Any-to-Any)万能模型的预览。这一模型能够接受文本、图像、音频和视频作为输入,并以任意模态生成输出,将简化应用开发,使同一模型能够执行多种任务,如内容模态转换、内容编辑,以及驱动能够理解和生成所有模态的AI代理。这一突破性的进展无疑将彻底改变生成式AI的游戏规则。

结语

亚马逊云科技在re:Invent大会上的连串发布,彰显了其在云计算与AI领域的深厚底蕴与不竭的创新动力。这些崭新的产品与技术,无疑将为生成式AI的发展注入强劲动力,加速其应用的广泛落地,为各行各业开辟更为广阔的创新空间与变革之路。(文/宋雨涵)