不愧是云计算大哥大！亚马逊云科技一口气发布六款大模型，3nm AI芯片，Any-to-Any突破传统-DOIT-数据产业媒体与服务平台

引言

【算力豹导读】云计算大哥大“亮家底”，算力革命即将到来！

在年度云计算领域的巅峰盛会AWS re:Invent大会上，亚马逊云科技（AWS）震撼登场，一举推出了6款全新大模型，并预告了即将问世的2款大模型，同时亮出了其科技利器——3nm制程的第三代AI训练芯片Trainium3，以及迄今为止性能最为强悍的AI服务器Trn2 UltraServer。此番举动标志着Amazon Nova系列基础模型的华丽首秀。

这一系列模型涵盖了Micro、Lite、Pro、Premier四大版本的语言模型，每一款都各具特色，满足不同场景下的应用需求。此外，还有令人瞩目的图像生成模型Canvas以及视频生成模型Reel惊艳亮相。特别是Reel，目前已能流畅生成6秒视频，而未来不久，其生成时长将拓展至2分钟，为用户带来前所未有的视觉盛宴。

风云变幻的生成式AI时代

在即将登台发表演讲之际，亚马逊云科技新任首席执行官Matt Garman提出了一个引人深思的见解：人工智能是一场永无止境的竞赛，它将会持续不断地向前推进。

目前，这场竞赛尚处于初期阶段。在经历了“全力投入大模型”的狂热之后，业界开始深思：在这场持久战中，接下来应把重点放在“细水长流”的稳健发展上。

对于各行各业的用户而言，可持续发展面临的首要挑战便是成本问题。如果说去年我们还在探索如何适应新兴的生成式AI技术，那么到了2024年末，更为关键的是：如何不断降低生成式AI的应用成本，即提高生成式AI技术应用的性价比。

在今日凌晨的主旨演讲中，Matt Garman分享了亚马逊云科技在人工智能和计算等领域取得的“新技术、新产品、新服务”成果，标志着生成式AI技术栈的又一次革新。

我们见证了一系列前沿的技术能力发布，这些发布令人震撼且源源不断。与此同时，技术的落地成本降低到了令人难以置信的水平。

这一系列升级，无疑堪称“真正的革命性变革”。在变幻莫测的生成式AI时代，亚马逊云科技再次展现了其“掌控全场”的实力。

将性价比做到极致

去年4月，亚马逊云科技正式踏入生成式AI大模型的竞技舞台，其首发的Amazon Titan系列模型当时专注于文本内容的生成与高效搜索功能的打造。仅仅一年多时间，亚马逊云科技已在基础模型层面完成了全面布局，正朝着涵盖文本、图像、视频及语音的全模态体系全力迈进，在与OpenAI、谷歌、Anthropic等业界巨头的竞争中，展现出了强劲的实力。

在今年的re:Invent大会上，亚马逊云科技自主研发的生成式AI多模态Amazon Nova系列模型惊艳亮相。该系列模型不仅在多种任务中达到了业界领先的智能水平，更在性价比方面树立了新的标杆。

亚马逊总裁兼CEO安迪·贾西（Andy Jassy）亲自见证了这一重要时刻。此次发布的Amazon Nova系列模型共包含四个版本：

纯文本模型Amazon Nova Micro，支持高达128k的上下文，能够以极低的成本实现最低延迟的响应；

成本效益显著的多模态模型Amazon Nova Lite，支持300k上下文或30分钟视频输入，能够迅速处理图像、视频及文本信息；

功能全面的多模态模型Amazon Nova Pro，同样支持300k上下文或30分钟视频输入，在准确性、速度与成本之间实现了完美平衡，适用于各种复杂任务；

以及性能最为强大的多模态模型Amazon Nova Premier，专为复杂推理任务设计，同时可作为自定义蒸馏模型的最佳教师模型。

在基准测试中，Amazon Nova系列模型展现出了非凡的实力。纯文本模型Amazon Nova Micro在与LLaMa 3.1 8B、Gemini 1.5 Flash-8B等模型的对比中，表现相当甚至更优。其210 tokens/s的输出速度更是业界领先，对于追求快速响应的应用场景而言，无疑是最佳选择。而多模态模型Amazon Nova Lite与Amazon Nova Pro在与OpenAI、谷歌、Anthropic等主流厂商的模型中，也在绝大多数基准测试中表现出色，尤其在处理轻量级任务时，Lite更是以极低的成本提供了卓越的多模态处理能力。

目前，Amazon Nova Micro、Lite、Pro三款模型已正式推出，并集成至Amazon Bedrock平台，支持自定义微调和蒸馏。而Amazon Nova Premier则计划于2025年第一季度面世。在性能全面提升的同时，Amazon Nova系列模型中的Micro、Lite与Pro版本的价格相比Amazon Bedrock中同类别的最强模型，至少降低了75%。这对于那些需要大模型服务、预算有限但又追求模型效果的客户来说，无疑是一个极具吸引力的选择。

此外，在图像与视频生成模型竞争日益激烈的当下，亚马逊云科技也展示了其强大的内容创作实力。独立的图像生成模型Amazon Nova Canvas与视频生成模型Amazon Nova Reel相继亮相：Canvas支持图像的生成与编辑，提供了丰富的配色方案与布局控件；而Reel则能根据关键提示词和参考图像生成6秒视频，并支持用户调整摄像头运动以实现平移、360度旋转和缩放等操作，未来还将支持2分钟视频的生成。

安迪·贾西还预告了另外两款即将推出的Amazon Nova模型：Amazon Nova Speech-to-Speech与Amazon Nova Any-to-Any。前者旨在实现自然、类人的口头交互体验；后者则致力于用同一个模型解决多种任务，包括多模态转换、内容编辑以及AI智能体操作等。这两款模型预计将于2025年第一季度和中期分别面世。

从文本到视频，Amazon Nova系列模型一次性全部上线，并直接对标了最新的技术发展方向。亚马逊云科技自研大模型的进化速度之快，让全场观众都为之震撼。

算力革命即将到来

过去十年，AI行业已达成共识：模型参数量的增长和计算复杂度的提升，离不开强大算力的支持。这一结论可以从两个简单维度来理解：一是向上扩展，即使用更强大的计算机；二是向外扩展，即使用更多的计算机。

然而，在生成式AI时代，由于模型涉及数十亿甚至上千亿的参数，设计、训练和部署这些模型都需要消耗巨大的计算资源。例如，每次训练都需要对海量数据进行复杂的矩阵运算和梯度计算，这对算力基础设施的要求远超以往。

对于希望应用生成式AI的企业而言，要追上OpenAI、谷歌等顶尖公司，就必须购买越来越多的高端芯片和云服务，这导致计算成本显著上升。据Gartner分析，到2025年，随着AI技术基础设施的不断升级，各个云支出领域的增长率都将达到两位数。

当前，核心问题在于如何在算力资源短缺的环境下扩大算力来源，并如何在高昂的计算成本压力下高效利用算力。对此，亚马逊云科技的自研AI芯片Trainium为企业用户提供了一个速度快、能耗低的优质选择。

Trainium是亚马逊云科技自研的AI芯片，自2020年首次推出以来，便因其高效的AI模型训练能力而备受瞩目。在今年的re:Invent大会上，亚马逊云科技宣布Trainium2芯片已全面正式可用，助力行业训练和部署大型语言模型。Trainium2的速度是其上一代产品的四倍，于一年前首次发布。

单个Trainium2驱动的EC2实例配备16个Trainium2芯片，可提供高达20.8 PetaFLOPS的计算性能。在测试中，与其他云服务商的类似产品相比，使用Amazon Bedrock Trn2 EC2实例的Llama 3.1 405B模型在token生成吞吐量上提高了三倍以上。

此外，亚马逊云科技与Anthropic正合作构建一个名为Project Rainier的Trn2 UltraServer集群。生成式AI爆发后，Anthropic大量使用了亚马逊云科技的算力设施，并一直紧追OpenAI。今年11月底，亚马逊宣布向Anthropic追加40亿美元投资，累计投资达80亿美元。基于深厚的合作关系，Anthropic将使用亚马逊云科技的Trainium AI芯片来训练和运行其AI模型。

Project Rainier集群将包含数十万个Trainium2芯片，为Anthropic提供足够的可扩展分布式计算能力，以训练下一代大模型。与Anthropic用于训练当前一代模型的集群相比，新集群的计算能力达到其五倍，并将成为全球最大的AI计算集群。

对于规模更大的万亿级参数LLM，亚马逊发布了第二层Trainium2实例——Trn2 UltraServer，同时提供64个Trainium2芯片用于AI模型训练或推理。它将允许用户超越单个Trn2服务器的限制，提供高达83.2 PetaFLOPS的峰值计算能力。

同时，亚马逊云科技的下一代自研AI芯片Trainium3也在研发中。这是该公司首款采用3nm工艺制造的芯片，性能将是Trainium2的两倍，能耗降低40%，性能可与英伟达的新一代AI芯片相媲美。

首批基于Trainium3的实例预计将于2025年上市。亚马逊云科技表示，搭载Trainium3的UltraServer性能将比搭载Trainium2芯片的UltraServer高出四倍。

在生成式AI技术快速发展的背景下，不断进化的亚马逊云科技为用户提供了一个可靠的“算力”选择。当业界热议“追逐Scaling Law是否还有意义”时，亚马逊云科技的Trainium系列和其一整套AI基础设施，无疑为各行各业的用户在这场技术浪潮中提供了坚实的“船桨”。

Any-to-Any万能模型

亚马逊云科技在大会上还推出了任意转任意（Any-to-Any）万能模型的预览。这一模型能够接受文本、图像、音频和视频作为输入，并以任意模态生成输出，将简化应用开发，使同一模型能够执行多种任务，如内容模态转换、内容编辑，以及驱动能够理解和生成所有模态的AI代理。这一突破性的进展无疑将彻底改变生成式AI的游戏规则。

结语

亚马逊云科技在re:Invent大会上的连串发布，彰显了其在云计算与AI领域的深厚底蕴与不竭的创新动力。这些崭新的产品与技术，无疑将为生成式AI的发展注入强劲动力，加速其应用的广泛落地，为各行各业开辟更为广阔的创新空间与变革之路。（文/宋雨涵）

不愧是云计算大哥大！亚马逊云科技一口气发布六款大模型，3nm AI芯片，Any-to-Any突破传统

lixiangjing

相关推荐

近期文章

热门标签