OpenAI 发布「o1」模型:具有人类般的推理能力

OpenAI 发布了全新模型「o1」的预览版,即之前被多次曝光的「草莓」,为该公司第一个具备推理能力的模型,一起发布的还有更小、更便宜的「o1-mini」。

据介绍,o1 与 GPT-4o 的主要区别在于能够解决编程和数学等复杂问题,OpenAI 用一种新的「强化学习」的方式训练 o1 模型,使其能够实现人类般的逐步思考能力,花更多时间去解决问题。模型会学习完善自己的思维过程,尝试不同的策略,并认识到自己的错误。
通过这种训练方式,OpenAI 表示虽然不能说 o1 解决了幻觉的问题,但出现幻觉的次数明显减少了。

OpenAI 使用国际奥林匹克数学资格考试对 o1 进行了测试,得分 83%,而 GPT-4o 得分 13%。
除此之外,目前 o1 模型的成绩,在美国数学邀请赛上,可以排名进入美国前 500 名。而物理、生物和化学问题上的准确度,超过了人类博士的水平

不过,OpenAI 也表示,目前新生的 o1 不具备 ChatGPT 的许多有用功能,无法浏览网页或者处理文件和图像能力,短期内 GPT-4o 将更强大,但 o1 代表了 AI 能力的新水平。
The Verge 表示,困扰 ChatGPT 和其他 AI 机器人的「Strawberry 有几个 r」问题,o1 能够正确回答。

ChatGPT Plus 和 Team 用户已经可以开始访问 o1-preview 和 o1-mini,企业和教育用户将于下周获得访问权限。OpenAI 表示计划为 ChatGPT 所有免费用户提供 o1-mini 模型,但未公布发布日期。

开发人员要调用 o1 API,输入 tokens 每一百万个价格 15 美元(折合人民币元 106.75 元),输出 tokens 每一百万个 60 美元(折合人民币约 427 元),远高于 GPT-4o。

来源:爱范儿