直播整活?OpenAI开启为期12天直播活动,满血o1震撼登场,史上最贵订阅费:1450元/月

引言

【算力豹导读】作为大模型的领军人物,OpenAI的每一次行动都紧紧牵动着众人的目光。

就在昨日,其首席执行官山姆·奥尔特曼(Sam Altman)以一种极具震撼力的方式,揭开了一项特别计划的神秘面纱:OpenAI将倾情呈现一场为期12天的直播马拉松,内容精彩纷呈,既有新品发布的激动人心,也有功能更新的耳目一新,更有一系列被誉为“圣诞礼物”的神秘环节,令人充满期待。

OpenAI的这一活动预告,犹如一颗石子投入平静的湖面,瞬间激起了层层涟漪,引发了全球的轰动。

全球的科技媒体为之沸腾,即便时差成为一道难以逾越的鸿沟,也阻挡不了他们渴望参与这场“科技盛宴”的满腔热情。

在北京时间12月6日凌晨两点,万众瞩目的“12 Days of OpenAI, Day 1”直播终于拉开序幕

重磅直播内容

1.推出o1正式版,这是首次将多模态能力与新型推理范式相结合的版本。相比于 o1 preview,它更加智能,响应速度显著提升。目前o1模型已全面上线,API 功能也将在不久后推出。

2.发布了全新专业版套餐——ChatGPT Pro,订阅费用为每月200美元,用户可无限访问OpenAI的模型,包括语音功能。此外,Pro套餐还引入了o1 Pro模式,在数学、科学和编码等挑战性机器学习基准测试中表现更好。

推出o1正式版

让我们先聚焦于广大用户能够亲身体验的o1大模型。直播活动结束后,ChatGPT Plus的用户群体已逐步迎来了o1模型的完整版本。回溯至9月,该模型首次以预览版的形式与大家见面。o1模型的一大特色在于,它并非简单地“脱口而出”答案,而是构建了一个类似人类思考的内部逻辑链条,显著提升了回答专业问题时的精确度。简而言之,新推出的完整版o1模型相较于预览版,速度更快、性能更强、准确度更高,并新增了多模态输入功能,即用户现在可以上传图片进行询问。

OpenAI透露,与预览版相比,当前的o1模型“思维过程已变得更加精简高效”(提速约50%),并且在应对复杂现实问题时,发生重大错误的概率降低了34%。在一次演示中,当被要求“列出2世纪罗马皇帝的名字、任期和主要成就”时,o1模型仅“思考”了14秒便给出了答案,而预览版则耗时34秒。值得一提的是,能力稍弱的GPT-4o在回答这个问题时还会出现错误。

o1模型的另一项重大更新是支持图片输入功能,这意味着用户可以在向模型询问如“太空数据中心散热问题”时,附上一张手绘示意图以辅助说明。OpenAI还表示,他们计划在未来数月内进一步增加功能,如网页浏览和文件上传等。

此外,OpenAI还展示了o1模型(以中间浅红色柱子表示)在回答数学、编程以及博士级别科学问题时的卓越表现,其准确率明显高于o1预览版(左边橘色柱子)。而右边的绿色柱子则代表了进一步的提升,那是专为ChatGPT Pro用户打造的o1 Pro模式。

一个月200美元的ChatGPT Pro

ChatGPT Pro是OpenAI推出的最新订阅档次,比ChatGPT Plus贵上10倍。

花费1个月200美元后,用户可以无限量地使用o1模型(Plus用户目前的限制是每周50条信息),以及无限量使用o1 mini和高级语音模式,同时也能用上o1 pro模式。

官方的定义称,o1 pro会使用更多的计算资源进入深入思考,并为“最难的问题提供最好的答案”。OpenAI未来也会给这个订阅档次,添加更多更强大、计算密集型的功能。

简而言之,如果您是一名科学研究人员或程序员,且o1模型的推理能力不足以满足需求,那么可以考虑尝试一下“氪金”进阶模式。

在演示中,OpenAI演示了通过设定一系列苛刻的条件,让o1 pro筛选出符合条件的蛋白质。

在OpenAI的公告中,也提到向10名医学研究人员赠送了免费ChatGPT Pro,研究领域涵盖孤儿病、癌症、痴呆等。这大概也是使用这个订阅服务的人群画像。

ChatGPT Pro的特色之一是引入了o1 pro模式,增加了计算资源投入,让模型在解答困难问题时进行更深入的思考和分析。这项服务主要面向需要进行高级数据分析和处理的科研人员、工程师以及其他专业人士,帮助他们提高工作效率并保持在人工智能技术最前沿。

根据外部专家的评测,o1 pro模式在处理复杂的数据科学、编程和案例分析问题时,能够提供比以往模型更为精确和全面的响应。在进行数学、科学和编程等领域的机器学习基准测试时,o1 pro模式的表现优于o1和o1-preview模型。

为了突出o1 pro模式的主要优势(提高可靠性),OpenAI使用更严格的评估设置:只有当模型在四次尝试中有四次能够正确回答问题(“4/4 可靠性”),才被认为解决了问题。

思维链CoT的推理方法

不论是预览版,还是完整版o1,都是通过大规模强化学习进行了训练,掌握了一种前沿的思维链CoT的推理方法。这种方法,不仅仅是简单地给出答案,而是像人类思考一样,逐步分析和推理。而且,o1系列模型的一个重大突破在于——安全性推理能力。

当面对潜在的不安全提示词时,它能精准理解上下文,根据预设安全策略进行深度推理。

这使得o1在多个安全基准测试中,展现出卓越的性能,比如有效地址非法建议的生成、拒绝刻板印象的响应、低于已知的模型越狱攻击。结合CoT的智能增强的同时,也带了潜在的风险。

为了确保模型安全,OpenAI研发团队采取了多层次的风险管理策略。比如,他们建立了稳健的对齐方法,进行了广泛的压力测试,并维护细致的风险管理协议。

数据和训练

在此之前,先来了解下o1的数据和训练过程。完整版o1是该系列旗舰模型,o1-mini是专注编码的轻量级版本。通过强化学习RL进行训练的目的,就是让o1系列能够进行复杂的推理。o1在回答之前进行思考——它可以在响应用户之前产生长的思维链条。

通过训练,模型学会了优化思维过程,去尝试不同的策略,并自主识别错误。推理使o1模型能够遵循OpenAI设定的特定指南和模型政策,帮助其符合安全期望。不仅如此,o1模型的训练数据源丰富多样,包括公开可用数据、通过合作伙伴关系访问的专有数据,以及内部开发的自定义数据集。

– 公共数据:

两个模型都在各种公开可用的数据集上进行了训练,包括网络数据和开源数据集。

关键组成部分包括推理数据和科学文献。这确保了模型在一般知识和技术主题上都很精通,增强了它们执行复杂推理任务的能力。

– 来自数据合作伙伴的专有数据:

为了进一步增强o1和o1-mini的能力,OpenAI通过战略合作,获取高价值的非公开数据集。

这些专有数据源包括收费内容、专业档案和其他特定领域的数据集,提供了对行业特定知识和用例的更深入见解。

– 数据过滤和优化

OpenAI数据处理管道包括严格的过滤,以保持数据质量和减轻潜在风险。研究团队使用先进的数据过滤流程来减少训练数据中的个人信息。他们还结合使用自家的审核API和安全分类器,防止使用有害或敏感内容,包括诸如CSAM等材料。

结语

OpenAI的这一系列动作,无疑将推动AI技术的进一步发展和应用。随着满血版o1模型和ChatGPT Pro的推出,AI技术在各个领域的应用将更加广泛和深入。同时,这也为相关企业和个人提供了新的商业机会和发展空间。

此外,据外媒报道,OpenAI还将在之后的直播中发布文生视频工具Sora等新产品。这些新产品的推出,将进一步丰富OpenAI的产品线,为用户提供更加多样化和个性化的服务。

综上所述,OpenAI的为期12天的直播活动已经拉开了帷幕,满血版o1模型和ChatGPT Pro的推出引发了广泛关注和期待。未来,随着AI技术的不断发展和应用,我们有理由相信OpenAI将为用户带来更多惊喜和突破。(文/宋雨涵)