本周易播报关键词:GPT-4o、Gemini、 Cobalt 100、台积电、5G-A

OpenAI正式发布GPT-4o

5月13日,OpenAI正式发布其大模型新版本GPT-4o(o代表omni,意为全能);并推出适用于macOS的ChatGPT桌面应用程序,预计年内发布Windows版本。

多模态端到端实时推理,无需转换,响应延迟大幅缩短:前代GPT-3.5和GPT-4对话模式可拆解为三步:音频转录为文本、模型接收文本并输出文本、文本转换回音频,意味着GPT-4丢失了大量信息—无法直接观察音调、多个说话者或背景噪音,亦无法输出笑声、歌唱或表达情感,GPT-3.5和GPT-4的平均响应延迟分别为2800ms和5400ms。而GPT-4o将所有输入和输出由同一神经网络处理,可实现跨文本、视觉和音频端到端实时推理,模型响应延迟缩短至232ms,平均响应延迟为320ms,接近人类日常对话的反应时间;多模态交互能力优越,能够接受文本、音频和图像的“混合”输入,快速响应完成推理。

价格减半,模型能效翻倍提升:与GPT-4Turbo相比,GPT-4oAPI在推理速率提升2倍、单位时间调用次数提升5倍的同时,价格减半。

免注册免费开放使用,功能多元化:用户无需注册即可免费使用全部功能,包括:1)体验GPT-4级别的智能;2)由模型或网络抓取生成答案;3)分析数据并创建图表;4)解析所上传的照片;5)帮助总结、生成或分析所上传的文件;6)使用GPTs及GPT商店;7)使用模型的“Memory”(记忆)功能。但免费用户在消息数量上存在限制,超过限制后将被切换回GPT-3.5。

情感交互及语言能力再升级:GPT-4o展现出对人类交流习惯的高度理解力和适应性,可准确识别和响应人类情绪,并提供更具情感、个性化的回应。另外,GPT-4o在50多种语言(可覆盖约全球97%的人口)中的处理速度及质量提升,实时翻译功能可助力不同语言使用者交流。

macOS无缝集成ChatGPT,UI界面优化:OpenAI推出适用于macOS的ChatGPT桌面应用程序,旨在将AI无缝集成至PC。使用键盘快捷键(Option+Space),即可向ChatGPT提问、在应用程序中截取屏幕截图并进行讨论。另外,公司为ChatGPT优化UI界面,新版本主屏幕及消息布局等更简洁且更具易用性。

谷歌IO大会新发布

  1. Gemini AI模型系列:谷歌发布了Gemini系列的最新AI模型,包括Gemini 1.5 Flash和对Gemini 1.5 Pro模型的升级。这些模型增强了对多模态信息的处理能力,例如,Gemini 1.5 Pro模型的上下文窗口从100万tokens增加到了200万tokens。
  2. Project Astra:谷歌正在筹备一款名为Project Astra的通用AI代理,它能够通过智能手机摄像头分析周围世界并与用户进行交互,理解上下文并采取行动。
  3. Veo视频生成模型:谷歌发布了名为Veo的视频生成大模型,能够生成超过一分钟时长的高质量1080p视频,并代表用户的创意愿景。
  4. 多模态Gemini Nano模型:谷歌宣布即将在Pixel手机上推出多模态Gemini Nano模型,提供文字、图片、视频、音频的理解能力,并具有隐私保护功能。
  5. 新一代AI模型Gemma 2:谷歌即将推出新一代AI模型Gemma 2,提供多种尺寸和全新架构,以满足不同开发者的需求并实现卓越的性能和效率。
  6. 多模态AI搜索:谷歌搜索负责人宣布了一项重大更新,将AI技术更深入地整合到搜索引擎中,引入视频搜索功能,允许用户上传视频来展示他们需要解决的问题。
  7. Android 15:谷歌发布了Android生态系统的“三大突破”,包括Circle to search(画圈圈搜索)功能、Gemini手机AI助手以及在手机本地运行的AI。

消息称微软下周将面向 Azure 用户开放自研 AI 芯片 Cobalt 100

本周,据外媒TechCrunch报道,微软有望会在下周举行的 Build 技术大会上公布多项云端软硬件技术,同时还将向 Azure 用户开放自研 AI 芯片 Cobalt 100 的使用权限

此前,微软在 2023 年 11 月的 Ignite 大会上正式公布自研芯片计划,相关芯片主要包含用于 Azure 云端通用型计算任务的 Arm 架构芯片“Microsoft Azure Cobalt 100”,以及专为 AI 打造的 Microsoft Azure Maia 100 AI 加速芯片。

微软当时重点强调了“Cobalt 100”芯片,这是一款 128 核心的 64 位 AI 处理器,号称针对通用工作负载进行了优化,具有“低功耗”和“高效能”特点,据称芯片性能比 Azure 使用的“前几代 Arm 芯片提升了 40%”

除了 Cobalt 100 外,微软还将在下周公布基于 AMD MI300X GPU 的 Azure 服务,这款 GPU 据称是 Azure OpenAI 服务中“最具成本效益的硬件”。

此外,微软还将介绍一款“实时智能分析系统”,这是一款实时性数据分析系统,允许用户将大量数据导入到平台上进行即时分析。该系统将原生支持 Kafka、亚马逊 AWS Kinesis 和 Google Cloud 等数据分析平台。

台积电着手准备HBM4基础晶圆

台积电近日出席本周举办的 2024 欧洲技术研讨会,展示使用 12FFC+(12 纳米级)和 N5(5 纳米级)工艺技术制造的 HBM4 基础 Dies,从而提高 HBM4 的性能和能效。

台积电设计与技术平台高级总监讲话如下:

我们正与主要的 HBM 存储器合作伙伴(美光、三星、SK hynix)合作,在先进节点上实现 HBM4 全堆栈集成。12FFC+ 基础 Dies 在满足 HBM 性能要求的情况下具备成本优势,而 N5 基础 Dies 又可以在更低功耗下达到 HBM4 预期速度。

采用台积电 12FFC+ 工艺(源自该公司成熟的 16 纳米 FinFET 技术)制造的基础芯片将能够构建 12-Hi 和 16-Hi HBM4 存储器堆栈,容量分别为 48 GB 和 64 GB。

使用 12FFC+ 工艺将实现 “高性价比” 的基础芯片,这些芯片将使用硅内插件将内存连接到主机处理器。

工信部明确强化5G-A、6G 等关键技术突破,人工智能、量子通信等前沿技术攻关

据新华网报道,世界电信和信息社会日大会 5 月 17 日在宁波举行。工业和信息化部副部长张云明表示,工信部明确强化 5G-A、6G 等关键技术突破,强化人工智能、量子通信等前沿技术攻关,强化创新体系和创新生态构建,使信息通信领域原创性、颠覆性技术创新成果竞相涌现。

据悉,工业和信息化部将加快推动信息通信业核心技术突破,全力提升产业链供应链韧性和安全水平,面向新型工业化,深化“5G + 工业互联网”融合应用,助力企业“质改数转网联”,面向社会生活,在教育、医疗、养老等领域深化数字技术集成创新和融合应用。

另据央视新闻报道,目前,中国移动已经率先在 100 个城市推进 5G-A 商用部署,年内将扩展至 300 个城市。

中国电信利用 5G-A 技术打造了南京、西安、深圳、广州等多个城市级的低空专用网络,赋能低空经济产业。

中国联通已建成 5G-A 通感一体、无源物联等技术的全产业链条覆盖的产品体系,并积极进行试点验证。

Canalys:2024 一季度全球云服务支出增长 21%,亚马逊微软谷歌前三

本周市场研究机构 Canalys 科纳仕咨询发布报告称,2024 年第一季度,全球云基础设施服务支出同比增长 21%达到 798 亿美元(约 5761.56 亿元人民币),相比去年增加 134 亿美元(约 967.48 亿元人民币)。

其中前三大云服务提供商 —— 亚马逊云科技 (AWS)、微软 Azure 和谷歌云总增长率为 24%,占总市场的 66%。由于企业在云计算上加速支出,三家头部云厂商的增长率均有显著提升。

AWS 在本季度保持市场领导地位,市场份额达 31%。收入同比增长 17%,AWS 的年收入有望实现 1000 亿美元。

微软 Azure 以 25% 的市场份额位居第二,2024 年第一季度,同比增长 31%,几乎是 AWS 的两倍。Azure 披露,与 AI 相关的需求为其收入贡献 7%。微软 Azure 宣布计划加强与 OpenAI 的战略合作伙伴关系,目前已有超过 65% 的财富 500 强公司使用 Azure OpenAI 服务。

谷歌云是第三大供应商,市场份额为 10%,但同比增长率达到 28%。在 2024 年 4 月的 Google Next 大会上,该公司宣布,Gemini 1.5 Pro 现在已在超过 180 个国家提供,为开发者提供语音理解能力和其他工具。