引言
【算力豹导读】谷歌势与Open AI“掰手腕”。
一周前,谷歌的 Gemini-Exp-1114 模型取代 GPT-4o,坐上了 Arena 榜单的头把交椅。
对于苦苦追赶 OpenAI 几个月的谷歌来说,这次在基准测试上的胜利十分振奋人心。
可惜振奋的时间不长:昨天,GPT-4o一个更新,把第一名的位置抢回来了。
奥特曼庆功的话音刚落,Gemini-Exp-1121杀出来,又把第一名抢走了。
风流涌动,大模型更新迭代以周为单位
从官方发布的介绍来看,Gemini-Exp-1114的亮点主要在于质量改进,而最新的 Gemini-Exp-1121重点改进了编码、推理和视觉能力。
这场争夺战的出现,却引出了另外一个角度的话题:当前的人工智能基准测试方法可能大大简化了模型评估。
就比如一周前,当研究人员控制了响应格式和长度等表面因素时,Gemini-Exp-1114的表现下降到第四位,因为传统指标可能会夸大感知能力。
这种差异揭示了人工智能评估中的一个根本问题:模型可以通过优化表面特征而不是展示推理或可靠性的真正改进来获得高分。对定量基准的关注引发了一场争夺更高分数的竞赛,行业对排行榜的依赖也会催生一些不良激励方式,而这些都无关于人工智能的真正进步。
各个厂商针对特定测试场景优化模型,同时可能忽略安全性、可靠性和实用性等更广泛的问题。这种方法产生的AI系统擅长完成狭隘的预定任务,但在处理细微的现实世界互动时却举步维艰。
比如有人就发现在LiveBench上,一周后更新的Gemini-Exp-1121版本,在数学和推理能力上反而比不上Gemini-Exp-1114,令人疑惑。
厂商之间为获得更高的基准分数而展开的竞争并不会停止,但真正的竞争可能在于如何开发全新的框架来评估和确保人工智能系统的安全性和可靠性。
谷歌Gemini 2.0 将于12月第二周发布!
谷歌AI新王牌蓄势待发!
就在今天,一条来自谷歌内部的消息在科技圈掀起了波澜。
谷歌云AI客户工程区域主管Dambo Ren透露:新版Gemini 将在12月发布!
更为确切地,据传,备受期待的Gemini 2.0 将于12月的第二周面世,并将带来一系列令人瞩目的新特性。
新特性令人瞩目
据悉,作为AI技术的又一次飞跃,Gemini 2将带来一系列令人瞩目的新特性。
CoT(Chain of Thought)推理能力将成为Gemini 2的一大亮点。这意味着模型在处理复杂任务时,将能够更好地模拟人类的思维链条,从而提高解决问题的效率和准确性。
此外,多模态能力的增强也让人期待不已。Gemini 2将在视觉、听觉等多种感知模式上实现更自然的交互,进一步突破人机交互的界限。
上下文窗口的扩展同样引人注目。Gemini 2将支持3到5百万的上下文窗口,这将极大地提升模型在处理长文本和复杂背景信息时的表现。
最令人兴奋的是,”Project Jarvis”的泄露。这一项目据称将打造一个类似于Claude 3.6的智能代理,深度整合于谷歌生态系统。此举无疑将为用户提供更为智能和无缝的体验。
谷歌的雄心还在于AI Agent
上周微软在“Microsoft ignite 2024”大会上发布10多个商用AI Agent后,
科技巨头谷歌也宣布全力推广商用AI Agent,发布一系列激励活动和产品。谷歌云将提供从AI Agent的开发、部署到应用一站式商用生态。
此外,谷歌还特意发布了全球为数不多的商用AI Agent市场,有点类似苹果的Store,只不过针对的是企业用户。而开发者也能通过用户的购买来赚取佣金。
谷歌全力推广AI Agent
为了帮助合作伙伴、开发者在商用AI Agent上取得成功,谷歌云发布了一系列激励计划。包括专门为AI Agent解决方案提供共同销售机会,扩大市场覆盖范围,增加销售机会。
谷歌云通过各种市场资源,例如,广告和活动,提高合作伙伴AI Agent的知名度,并通过博客和专门的活动展示合作伙伴的明星级产品,增加AI Agent的曝光率,帮助合作伙伴在竞争激烈的AI Agent生态系统中脱颖而出。
AI Agent市场(Space)则是谷歌推广计划中非常重磅的一个产品,才刚刚上线几天可用的产品并不多只有19款,还在持续更新中。但对于AI Agent的商业发展具有里程碑意义。
用户可以在AI Agent市场中快速找到想要的AI Agent,极大简化了客户的选择和部署流程。同时,还提供了免费试用的机会,新客户可以获得300美元的免费信用额度,来体验选中的产品。
结语
谷歌在大模型领域的雄心显而易见,其通过不断推出创新的人工智能模型来巩固和扩大其在该领域的领先地位。
AI领域的激烈竞争态势,在OpenAI、谷歌等科技巨头的角力中,每一次重要发布都可能改变行业格局。不过无论如何,谷歌选择在年底这个时间点发布新版Gemini,必将为AI竞争掀开新的篇章。(文/宋雨涵)