2024年AI大事件回顾

OpenAI技术突破与产品更新

– 推出GPT-4o及相关版本:2024年,OpenAI动作频频,5月14日推出新旗舰生成式AI模型GPT-4o,该模型集文本、音频、视觉于一身,语音水平接近人类,展现出强大且丝滑的多模态能力,其CEO奥尔特曼称其为“最好的模型”并免费开放,推动了AI在教育、娱乐、医疗等诸多领域的应用。

– 开放Sora使用:2月16日,OpenAI推出文生视频大模型Sora,它能够依据简短文本提示或一张静态图片生成长达60秒的高清视频,涵盖多角色、不同动作和背景细节等,几乎达电影级逼真场景,还被视为能够理解和模拟现实世界的基础模型,推动行业架构设计变革,12月9日,Sora Turbo版本向ChatGPT付费用户开放,且用户可使用多种工具进行视频编辑等操作,不过使用门槛较高。

– OpenAI 12天发布会直播:12月5日至20日,OpenAI完成连续12个工作日的12场直播,首日发布满血版O1模型,期间期待许久的Sora Turbo正式发布,最终以官宣新一代推理模型O3收官,使我们似乎离通用人工智能又更近了一步。

英伟达与谷歌的重大技术进展

– 英伟达Blackwell芯片投产:3月19日,英伟达CEO黄仁勋在英伟达GPU技术大会上宣布即将发布新一代AI芯片架构Blackwell,该芯片以美国数学家和博弈论学家David Blackwell命名,继承Hopper GPU架构,拥有2080亿个晶体管,是英伟达首个采用多芯片封装设计的GPU,在单个芯片上集成了两个GPU,其推理能力是Hopper的30倍,被外界称作“史上最强AI芯片”,且该芯片已为谷歌、Meta、AWS和OpenAI等的前沿人工智能项目提供支持,到明年10月为止的订单已售空。

– 谷歌量子芯片问世:12月10日,谷歌宣布研发出一款超强量子芯片Willow,面积仅4平方厘米却集成了105个量子比特,只用5分钟即可完成现有最快计算机需10²⁵年才能完成的任务,且具有突出的纠错能力,解决了相关领域近30年研究的关键难题,轰动全球科技界。

科技巨头的产品发布与战略布局

– 苹果首款AI手机发布:10月,苹果发布iOS 18.1,其AI套件“Apple Intelligence”登陆兼容设备,如iPhone 16、iPhone 15 Pro以及最新的iPad和Mac,带来更智能的写作功能、电子邮件和消息摘要、Notes和电话的转录功能等,照片管理及Siri也得到显著升级,正式进军AI领域。

– 特斯拉“Robotaxi Day”:10月11日,特斯拉在“We, robot”发布会上推出无人驾驶出租车“Cybercab”、无人驾驶巴士“Robovan”以及新一代人形机器人Optimus,预示着未来出行和生活的新纪元,马斯克称未来人们可能花费两三万美元就能拥有一台Optimus机器人。

– 亚马逊推出AI购物指南:10月,亚马逊推出AI购物指南,率先在美国上线,该工具将产品的关键细节整合成易于阅读的格式,使在线购物更高效,有望彻底改变在线购物方式,为消费者节省时间。

其他重要的AI事件

– Meta发布最大开源AI模型:7月,Meta发布Llama 3.1 405B,这是世界上最大的开源AI模型,拥有4050亿参数,能够处理复杂任务,如数学问题、多语言翻译等,并于10月推广到22个国家,新增七种语言,还推出“Imagine Me”等创意功能,增强了Meta AI的竞争力,成为顶尖模型的有力竞争者。

– Adobe Firefly 3推出:4月,Adobe推出生成式AI工具Firefly 3,并集成到Photoshop和InDesign等软件中,为设计师提供强大创作控制力,可生成图像、背景及类似设计等,且注重内容安全性,确保生成内容可合法用于商业用途,为AI在专业内容创作中的应用设立新标准。

– 我国AI公共算力平台建立:2024年我国构建了首个AI公共算力平台,依托上海超级计算中心,探索算力调度新模式,为科研机构和中小微企业的AI技术研发与应用提供有力保障,推动了我国AI技术的发展。

– AI编码工具崛起:随着AI在编程中的广泛应用,AI编码初创公司如Anysphere、Poolside、Codeium等受到资本市场青睐,获得高额融资,同时促使教育界重新审视计算机科学课程设计。

– Character.ai事件引发关注:美国Character.ai平台开发的聊天机器人向少年提出极端建议,引发公众对AI技术道德边界和青少年心理健康问题的担忧,促使该平台计划推出家长控制功能等整改措施。

– 大量AI法规推出:2024年,欧盟《人工智能法案》8月通过成为法律,美国45个州出台近700项人工智能立法,此外NIST、UNESCO等组织也推动相关标准制定工作,AI安全和问责受到高度重视。