OpenAI 推出了 GPT-4o,这是为其标志性产品 ChatGPT 提供动力的 GPT-4 模型的迭代版本。OpenAI 首席技术官米拉-穆拉提(Mira Murati)在周一的现场直播公告中说,更新后的模型 “速度更快”,并提高了 “跨文本、视觉和音频的能力”。穆拉提补充说, GPT-4o将对所有用户免费,付费用户将继续 “拥有五倍于免费用户的容量限制”。
OpenAI 在该公司的一篇博文中表示,GPT-4o 的功能 “将反复推出”,但其文本和图像功能将于今天开始在 ChatGPT 中推出。
OpenAI 首席执行官山姆-阿尔特曼(Sam Altman)表示,该模型是 “原生多模态 “的,这意味着该模型可以生成内容或理解语音、文本或图像命令。Altman 在 X 上补充说,想使用 GPT-4o 的开发者可以访问 API,其价格是 GPT-4 Turbo 的一半,速度是 GPT-4 Turbo 的两倍。
作为新模式的一部分,ChatGPT 的语音模式将增加新功能。该应用将能充当类似于 Her 的语音助手,实时回应并观察你周围的世界。目前的语音模式则比较有限,一次只能对一个提示做出反应,而且只能处理它能听到的内容。
Altman 在直播活动后发表的一篇博文中回顾了 OpenAI 的发展轨迹。他说,公司最初的愿景是 “为世界创造各种利益”,但他承认公司的愿景已经发生了转变。OpenAI 一直因没有开源其先进的人工智能模型而饱受批评,而 Altman 似乎是在说,公司的重点已经转变为通过付费 API 向开发者提供这些模型,并让这些第三方进行创造。”取而代之的是,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种神奇的东西,我们都将从中受益。”
在今天的 GPT-4o 发布会之前,有相互矛盾的报道预测,OpenAI 将发布一个可与谷歌和 Perplexity 匹敌的人工智能搜索引擎、一个内置在 GPT-4 中的语音助手,或者一个全新的改进型 GPT-5。当然,OpenAI 肯定会把发布时间定在谷歌 I/O 大会(科技巨头的旗舰会议)之前,我们期待看到 Gemini 团队在大会上发布各种人工智能产品。