2025年的CES大会主题演讲上,英伟达首次分享自己的智能体(代理型AI)新战略,还列举了智能体最新4种能力的应用场景,辅助研究、虚拟实验室模拟、软件安全辅助,以及影像分析。
智能体可以扮演一位研究助手,帮用户阅读pdf等格式文件以音频形式互动,还能化身软件安全专家,进行漏洞扫描并提供防护建议,还是研究人员的重要帮手,提供化合物设计与筛选,更像是一名专业的影像分析专家,可协助异常事件侦测与改善作业流程。
黄仁勋在演讲中强调,“智能体时代已经到来,成为企业工作流程中的重要环节”。
智能体指的是一套多模型(multi-model)系统,由多种功能模型组成,处理不同任务。它能将任务拆解为一个个任务,通过数据检索、工具操作、计算机运算或GAI生成图表等,提供高品质的回应。同时,智能体持续对这些模型进行迭代与优化,不断提升回应的准确性与效率。
黄仁勋指出,智能体的一大特色是,将使得AI的回应不再局限于单纯的问答模式,而是依靠多个模型在背后同步运作,进行更精细的计算推理,因此,在推理过程中采用测试时间扩展(Test-time scaling)机制,提供更高品质的回答,就很重要。“Test-time scaling的最佳实例就是智能体应用。”
英伟达的智能体策略,专注于与IT领域的软件开发商合作,构建生态系统以及整合技术,协助开发者和企业实现全新的智能体功能与应用。他表示,过去英伟达的GPU依赖CUDA加速函式库来加速运算处理,未来针对智能体需求,英伟达也会有AI专用函式库,架构在CUDA加速库之上,为开发者与企业提供更完整的技术支持。
英伟达的智能体应用开发三层式架构
英伟达在今年CES大会中提出了智能体应用开发三层式架构软件堆叠,协助企业快速实现应用落地,壮大智能体生态系。
英伟达的智能体架构是以区块为基础,最底层是模型预训练的AI微服务NIM。NIM将GenAI执行所需的模型和软件进行优化与封装,并部署于任一环境中。这些微服务涵盖多种AI模型,例如视觉模型、语言理解模型、语音模型(用于动画)、数位生物学模型,以及最新的物理AI模型等。
再上一层是NeMo框架,类似数字员工养成的Pipeline,让智能体能够担任多种工作角色,例如创作者、定制者、评价者、守护者,以及RAG检索者,实现多样化的应用场景。
为了让智能体具备特定领域的专业技能与知识,英伟达采用类似员工培训的方式,对智能体进行数字劳动力优化。经过培训的智能体能代理多种工作角色,包括辅助研究助手、虚拟实验室AI、软件安全专家、影像分析师、AI销售代表、客服人员、金融分析师、员工支援以及工厂运维管理者等,满足各行业的多元需求。
比如影像分析AI代理,是基于英伟达Metropolis蓝图,整合英伟达Cosmos、Nemotron视觉语言模型、Llama Nemotron LLM和MeMo Retriever等,能快速分析摄影机的数据,每天生成高达10万TB的影片内容。Metropolis代理可以应用到不同场景,例如在工业场域中,可以用来监测作业流程并提供改善建议,同时从数据中侦测异常情况,调整工作者或机器的路线,协助避免意外事件的发生,提升生产效率与安全性。
英伟达提出智能体最后一层是数字AI代理人蓝图,英伟达提供多种开放原始码蓝图,开发者可直接修改与扩展,用于建构特定领域的AI代理应用。在该蓝图中提供开发人员各种代理AI构建模组,包括CrewAI、Daily、LangChain、LlamaIndex和Weights & Biases等,协助其建立下一代智能体应用。
黄仁勋表示,企业智能体将成为AI工厂的核心驱动力,这些工厂将通过生成Token,为各行各业带来前所未有的智慧化与生产力提升。他特别看好智能体在软件行业的应用,并认为下一个人工智能服务的重要时刻将聚焦于软件,这是所有开发者都需要的基础。甚至预测,智能体有潜力成为下一个机器人产业的关键应用,创造兆亿美元的商机。
不仅仅是应用在软件行业,随着智能体应用逐渐成熟,也将影响企业内部IT的运作模式。黄仁勋表示:“企业IT部门将转型为类似智能体的HR部门。”他进一步解释,过去IT部门主要负责管理和维护大量来自IT行业的软件,而未来的重点将转向维护、培养和优化数位代理,并将它们应用于企业内部,提升运营效率。