导读
在这个数字洪流激荡、创新浪潮翻涌的新时代,算力不仅是衡量一个国家科技版图上璀璨星辰的亮度标尺,更是驱动数字经济巨轮破浪前行的澎湃引擎。
本月刊是精心策划的专栏,为您缓缓展开2025年1月份以来算力世界以及人工智能领域的精彩篇章,涵盖公司新闻、产品动态、政策发布与会议活动四大板块。

文字编辑|李祥敬
1
公司新闻
国产大模型之光DeepSeek,671B大模型训练只需此前算力1/10,性能比肩GPT-4o
在2024年12月26日,素有“AI领域拼多多”之称的DeepSeek公司,正式推出了其最新系列的模型——DeepSeek-V3的首个版本,并同时宣布该版本将面向公众开源。
这个新型人工智能模型配备了高达6710亿个参数,但得益于其创新的MOE(混合专家)架构设计,它能根据具体任务需求智能地激活相关参数。在处理每个词元时,它仅需激活约370亿参数,从而实现了高效且精准的任务处理能力。
DeepSeek-V3的此次发布在业界引发了广泛关注与振奋,这不仅因为它是一款开源模型,更重要的是,测试数据表明,其性能已经超越了诸如Meta的Llama 3.1-405B和阿里Qwen等主流开源模型,甚至在某种程度上逼近了Anthropic和OpenAI等封闭模型的性能水平,显著缩短了开源与闭源AI之间的性能差距。
IBM原全球副总裁谢东正式加入北电数智
1月2日,IBM原全球副总裁、大中华区首席技术官谢东博士去向明确,正式出任人工智能创新型国企北京电子数智科技有限责任公司(简称“北电数智”)首席技术官。
谢东博士,是中国数字经济和人工智能产业领域的杰出领军人才,本、硕、博均毕业于清华大学自动化专业,多年来身处技术管理和商业的一线,在技术战略规划、研发体系建设及大型项目管理、技术创新突破等方面拥有丰富成功经历,出色的团队领导能力和全球化视野也广受行业赞誉。
据悉,在IBM任职期间,谢东博士不仅主导了IBM中国半导体部门从0-1的建设,管理过超5000人的全球化产研团队,还推动了广为人知的IBM企业级AI产品Waston X在中国的全流程开发与商业化落地,相关成果在互联网、先进制造等多个关键场景中广泛应用,并拥有超过30项技术发明专利,三度荣获IBM杰出技术成就奖。
阿里零一万物强强联合!共建“产业大模型联合实验室”
近期,零一万物公司与阿里云在模型平台业务领域宣布了战略合作事宜,双方将携手共建“产业大模型联合实验室”,旨在加速大模型技术向实际应用的转化,并深化产业大模型的生态整合。
该“产业大模型联合实验室”涵盖了技术、业务、人才培养等多个维度。阿里云与零一万物将整合双方在全球大模型研发领域的顶尖实力,实现从下一代基座模型的技术探索到产业应用大模型服务的全面布局。双方将通过阿里云百炼大模型平台的模型服务层,针对ToB行业推出更为强大且全面的大模型解决方案,推动大模型技术在各行各业中的广泛应用。
在合作中,阿里云凭借其从技术、算力到服务层的平台级完整生态链,以及通义系列大模型作为具备强大通用能力的“教师模型”,而零一万物则拥有国际领先的高性价比模型技术,能够高效批量训练垂直领域的产业智能模型。双方的强强联合将极大地加速大模型技术在产业中的落地,进一步拓宽大模型的生态发展空间。
微软计划在2025财年投入800亿美元建设人工智能数据中心
2025财年,微软公司宣布将投入800亿美元用于建设专门处理人工智能(AI)工作负载的数据中心。
根据公司在其官方博客上的声明,这一计划将加速AI模型的训练以及云应用的全球部署。微软副董事长兼总裁布拉德・史密斯表示,超过一半的资金将用于美国的建设,展现了美国在这一新技术浪潮中的重要地位。史密斯在声明中指出:“展望未来,人工智能势必成为一种改变世界的技术。AI有潜力推动各个行业的创新与生产力提升。” 他强调,若美国能够利用自身优势,并有效地与国际合作,未来将能在这场科技革命中处于领先地位。
早在2024年4月,微软就与OpenAI进行了关于建设一个名为 “星门” 的AI超级计算机的数据中心的初步谈判。这一设施的建造费用预计超过1000亿美元。这也是微软首次在证券交易委员会(SEC)的备案中将OpenAI称为“竞争对手”,这显示出两家公司之间日益紧张的竞争关系。
黄仁勋化身美队发布新「核弹」RTX5090!还有一台掌中超算
在北京时间1月7日早晨10点30分,英伟达公司的首席执行官黄仁勋,于拉斯维加斯的CES 2025展览会上,进行了一场精彩的主题演讲。演讲涵盖了GPU技术、人工智能、游戏产业以及机器人技术等多个领域。
演讲伊始,黄仁勋带领听众回顾了英伟达GPU的发展历程。从早期的2D图形处理,逐步演进至3D领域,再到CUDA技术的诞生,以及后来的RTX技术的推出。步入人工智能时代后,GPU更是成为了推动AI技术从感知阶段迈向生成阶段的关键力量。他进一步展望,未来的AI将朝着智能体的方向发展,并且很快就会有能够进入物理世界的人工智能出现。黄仁勋CES演讲亮相RTX 5090。
在演讲的高潮部分,身着崭新皮衣的黄仁勋以模仿美国队长的姿势亮相,瞬间点燃了现场的气氛,引来阵阵笑声。紧接着,他没有让观众久等,迅速揭晓了众人期待已久的基于Blackwell架构的新一代RTX 50系列显卡。
其中,RTX 5090 GPU以其卓越的性能脱颖而出,成为了迄今为止速度最快的GeForce RTX GPU。它内置了高达920亿个晶体管,每秒可进行超过3352万亿次的AI运算,相较于上一代RTX 4090,其性能提升幅度接近两倍。
而RTX 5080的设计目标则是直指性能翻倍,它配备了16GB的GDDR7显存,内存带宽高达960GB/秒,并拥有10752个CUDA核心。英伟达方面明确表示,RTX 5080在性能上将远超上一代RTX 4080,为玩家和创作者带来前所未有的使用体验。
2024胡润中国人工智能企业50强榜单:科大讯飞第二、商汤科技第三
胡润研究院正式发布了《2024胡润中国人工智能企业50强》榜单。此次榜单中,AI芯片企业寒武纪以2380亿人民币的估值荣登榜首,展现了其在人工智能领域的强大实力。紧随其后的是智能语音企业科大讯飞,以1160亿的估值位列第二。商汤科技作为一家在机器视觉和大模型领域颇具影响力的公司,以500亿的估值位居第三。
在企业分布方面,北京以20家企业的数量遥遥领先,上海和深圳分别有9家和8家企业入榜,而广州则有4家。整体来看,一线城市的企业占据了榜单总数的80% 以上,这显示了这些城市在人工智能领域的集聚效应和重要地位。
从细分领域来看,视觉识别类企业表现活跃,榜单中有13家此类企业,紧随其后的是11家自动驾驶类企业、8家内容生成类企业、7家数据分析决策类企业、6家语音识别类企业以及5家算力硬件类企业。胡润百富董事长兼首席调研官胡润提到,这些企业在增强人类能力方面,可以归纳为五个方面:脑、眼、耳、手和腿。
“脑”代表了AI算力公司,如寒武纪、燧原科技和嘉楠科技;“眼”指的是机器视觉公司,代表有旷视科技、奥比中光和虹软科技;“耳”是智能语音领域,科大讯飞、拓尔思和思必驰是其代表;“手”则为AIGC大模型公司,如月之暗面、智谱华章和稀宇极智;而 “腿”主要涵盖自动驾驶公司,滴滴自动驾驶、小马智行和文远知行等。
OpenAI让AI圈一夜未眠,震撼发布AI智能体!
OpenAI最新发布了研究预览版的代理工具,命名为Operator,它能像人类一样自如地浏览网页并执行多种在线任务。这一工具的推出,标志着AI从被动的辅助工具转变为积极的参与者,预示着数字生活方式将变得更加智能、便捷。目前,Operator仍处于研究预览阶段,且仅对美国地区的Pro用户开放。
OpenAI官方介绍:Operator是我们的首批智能体之一。这些AI能够独立为你完成工作——只需给它一个任务,它就会执行。
DeepSeek朝硅谷“开了一枪”,登顶苹果中国区免费榜第一宝座,相关微博热搜刷屏
在AI技术日新月异的今天,一场来自东方的技术风暴正席卷全球。中国AI初创公司DeepSeek(深度求索)以惊人的速度崛起,不仅在国际舞台上大放异彩,更在国内市场取得了突破性成就——登顶苹果中国区免费榜第一!这一壮举不仅让DeepSeek成为了微博热搜的焦点,更标志着中国AI技术已经站上了世界之巅。
DeepSeek:中国AI的黑马
DeepSeek,这家成立不久的AI初创公司,却以惊人的速度在AI领域崭露头角。从DeepSeek-V3到DeepSeek-R1,DeepSeek在短短一个月内相继推出了两款性能卓越的大模型,不仅性能与OpenAI的顶尖模型相媲美,更在成本上实现了极致的优化。DeepSeek-V3的训练成本仅为558万美元,而DeepSeek-R1更是以极低的API调用成本,提供了与OpenAI o1相当的推理能力。
这种“四两拨千斤”的模式,彻底颠覆了人们对AI技术高投入、高产出的固有认知。DeepSeek用实际行动证明,即使在没有尖端芯片和巨额投资的情况下,也能训练出世界一流的AI模型。
2
产品动态
通义千问大模型成功部署黑芝麻智能车规级芯片
阿里云与黑芝麻智能的最新合作在国内智能汽车领域掀起新浪潮。阿里云宣布,其通义千问15亿和30亿参数大模型已成功移植到黑芝麻智能的武当C1200系列车规级芯片上,标志着国产大模型在车载场景的重要突破。在实际应用中,该集成方案可支持离线环境下的多轮自然对话,为用户提供流畅的人机交互体验。这一技术突破不仅展现了国产AI芯片的研发实力,更为智能汽车的发展注入新动力。
值得关注的是,在2024年9月,黑芝麻智能已与斑马智行展开跨域合作。双方致力于将智能座舱与智能驾驶系统整合到单一芯片上,打造”舱驾一体”解决方案。这一创新举措有望显著提升整车智能化水平,为用户带来更优质的驾乘体验。展望未来,阿里云表示将继续推进通义大模型与黑芝麻智能新一代华山A2000系列芯片的适配工作。这一计划的实现将为智能出行领域带来更强大的算力支持,进一步提升车载智能化体验。
高通展示新一代AI芯片Snapdragon X系列,赋能PC、汽车与智能家居
在2025年国际消费电子展(CES2025)上,高通公司展示了其在PC、汽车、智能家居和企业领域的新一代AI技术及合作成果。此次展会在拉斯维加斯举行,高通通过其芯片的AI能力,推动各类设备用户体验的转型,展示了智能科技的未来。
高通公司首次推出了Snapdragon X平台,这是其高性能PC系列中的又一力作,标志着该系列的第四大平台正式面世。Snapdragon X系列处理器凭借卓越的行业领先性能、超长电池续航力以及对AI技术的引领,为Windows生态系统带来了更为出色的用户体验。
高通宣称,其处理器在能效方面取得了重大突破,从而成功从AMD和Intel手中夺取了市场份额。特别值得一提的是,该系列处理器的神经处理单元AI性能高达45TOPS,这一关键性能指标无疑确立了高通在AI PC领域的领先地位。
不仅如此,Snapdragon X系列的增长势头强劲,目前已有超过60款产品正处于设计、生产或开发阶段,预计至2026年,这一数字将攀升至100款以上。
OpenAI又一大动作!开年第一剑,智能体「Tasks」,让AI有了执行力,解决你的大小事务
2025年伊始仅过半月,OpenAI在智能体技术方面迈出了重大一步。
此刻,OpenAI正为ChatGPT引入一项名为“Tasks”的新测试特性,该特性使用户能够为未来设定行动计划和提醒。
想象一下,若你希望在每日早上7点获取天气预报,或是需要一个关于护照即将过期的提醒,亦或是在夜晚入睡前给孩子讲述一个有趣的敲门笑话……现在,通过ChatGPT的“Tasks”功能,无论是单次还是重复性的任务,它都能帮你妥善安排。
与以往发布新功能时撰写长篇博客不同,OpenAI此次仅通过两条推特就宣布了这一消息。
“今日,我们推出了‘Tasks’特性的测试版——这是一种全新的方式,允许你在将来的某个时刻指示ChatGPT为你执行任务。不论是一次性的提醒,还是周期性的动作,只需告诉ChatGPT你的需求及具体时间,它就会自动为你安排妥当。”
讯飞星火X1数学碾压o1封神,首个全国产算力推理大模型问世!
1月15日,科大讯飞正式推出了讯飞星火X1,这是目前全国产算力平台上独一无二的深度推理大模型,并已率先在教育、医疗等关键需求领域实现了应用。
与此同时,讯飞星火4.0 Turbo的底座能力也迎来了全面升级,其图文处理、数学运算以及长文本理解能力均得到了显著提升。
此外,科大讯飞还首次推出了混域知识搜索技术,旨在更有效地解决行业与企业的痛点问题。作为国内智能翻译领域的领航者,科大讯飞还推出了星火语音同传大模型,这是业界首个具备端到端语音到语音同声传译能力的大模型,其语音同传的时延最短可达5秒以内。
智谱发布GLM-4-Air、GLM-4V-Plus模型
继「智谱清言」视频通话功能后,智谱深入探索语言、语音、图像及视频理解与生成,推出GLM-Voice、GLM-4V、CogView、CogVideoX等多模态模型。
现发布全新端到端多模态模型GLM-Realtime,实现近乎实时视频理解与语音交互,含清唱功能,支持2分钟记忆及Function Call。同时,升级GLM-4-Air和GLM-4V-Plus模型,提供高性价比语言模型解决方案。特别设立Flash系列普惠模型,免费开放,助力开发者创新。
MiniMax震撼开源,突破传统Transformer架构
2025年,AI Agent或将大量加入劳动力,影响公司生产力。OpenAI CEO Sam Altman、Meta CEO Mark Zuckerberg及英伟达CEO黄仁勋均预测2025年为AI Agent之年。随后,MiniMax开源了新模型MiniMax-Text-01和MiniMax-VL-01,采用线性注意力机制,处理上下文长达400万token,助力Agent应用爆发。
MiniMax-Text-01通过一系列创新,如新型线性注意力、改进版混合专家架构等,解决了大模型在处理超长上下文时的效率与效果问题。其架构中的Lightning Attention大幅降低了计算复杂度。混合专家(MoE)技术也提升了模型效率。此外,MiniMax还采用了数据格式化、分批核融合等优化策略。
面壁智能最新的模型——MiniCPM-o 2.6
这个AI是面壁智能的最新模型MiniCPM-o 2.6,因仅8B体量却能在多模态能力上与GPT-4o比肩而在海外爆火,且能在iPad上运行。
MiniCPM-o 2.6能精准识别翻书声、咳嗽声等,在看和说方面也有出色表现,如“睁眼”玩儿三仙归洞、扮演各种角色等。网友们称赞其超酷,像给iPad装了第二个大脑。
面壁智能还公布了MiniCPM-o 2.6在多模态能力评测榜单的成绩,整体能力已可比肩GPT-4o,部分项目甚至超越。面壁智能称MiniCPM-o 2.6为开源社区最强语音、端侧视觉、实时流式多模态模型。实测中,MiniCPM-o 2.6视力水平高,能精准回答删除的字、识别游戏名等,因其能做到真·看视频,持续对实时视频和音频建模。
追平满血版o1的国产多模态模型,Kimi首次公开模型训练技术报告
春节前最后一周,一款能与OpenAI满血版o1(指Full Version,非preview版本)相媲美的模型终于横空出世!月之暗面公司刚刚发布了其Kimi k系列模型的最新版本——k1.5多模态思考模型。
这款新模型在数学、代码以及多模态推理能力等各方面,都全面向OpenAI的满血版o1看齐,并且它是OpenAI之外首个实现这一水平的多模态o1级别模型。特别值得一提的是,其中的kimi-k1.5-short版本,更是成为了SOTA(state-of-the-art)级别的short cot模型,其性能大幅超越了GPT-4o和Claude 3.5 Sonnet,提升幅度高达550%。
月之暗面公司也因此成为了OpenAI之外,首家在数学和代码能力上达到满血o1水平的AI公司。
在此之前,虽然有一些模型在各类Benchmark测试中能取得50分、60分的成绩(相当于o1-preview的水平),但OpenAI的满血版o1则是80分、90分的水平。而月之暗面的Kimi k1.5模型所取得的成绩,无疑让人眼前一亮。
智谱推出AI生视频产品清影2.0已在智谱清言全量上线
北京智谱华章科技有限公司于2025年1月21日宣布其旗下AI生视频产品清影2.0完成重磅更新,带来了一系列令人瞩目的技术突破和功能提升。
清影2.0在模型结构、训练方法和数据工程方面进行了全面升级,基础模型能力大幅提升38%。这一改进使得清影2.0能够生成动作更自然、画面更精美且稳定可控的视频内容。用户仅需输入简单的提示词,即可让视频中的画面主体进行大幅度运动,同时保持画面的稳定性。例如,清影2.0能够生成男子从海报中走出、整理领带并进行特写镜头的连贯动作,展现了其在动作连贯性和画面稳定性方面的显著进步。
清影2.0在指令遵从能力上继续保持行业领先水平,能够理解和实现各种复杂的提示词。它不仅能够严格遵循用户的要求,还能在执行过程中融入自身的创意理解,从而赋予视频内容新的生命力。例如,它可以根据提示生成小狗将锅放到燃气灶上并搅拌的画面,同时保持视频内形象主体、风格和氛围的一致性,确保故事的完整性。
此外,清影2.0在艺术风格和画面美感方面也实现了大幅提升。它能够驾驭写实风格、三维动画、二维动画以及多种特殊艺术风格。无论是让全家福动起来的写实风格,还是小鸟与大熊猫互动的三维动画风格,亦或是其他艺术风格,清影2.0都能生成精美且风格一致的画面。
DeepSeek-R1令全网为之欢呼,性能比肩o1,价格只有其1/50
被誉为国产之光、AI界的“拼多多”的DeepSeek开源模型团队,在成功推出V3模型后,再次震撼发布了一款名为R1的顶尖模型,令国内外开发者为之振奋。
2024年末,DeepSeek-V3一经上线,便在AI领域掀起波澜,吸引了全球开发者的广泛关注。其性能直逼GPT-4,但服务价格仅为后者的十分之一,且整个训练成本控制在557.6万美元,这一成就让业界为之惊叹。
如今,DeepSeek最新推出的推理模型DeepSeek-R1,其性能与OpenAI的o1正式版不相上下,而服务价格更是仅为o1的约3%。更为难能可贵的是,DeepSeek团队慷慨地将R1模型训练中的技术创新全部公开,旨在促进技术社区之间的深入交流与协同创新。
DeepSeek-R1模型发布后不到一天,其在GitHub上发布的论文便迅速积累了超过5000次收藏。同时,相关话题在YC黑客新闻、Reddit及X等多个平台上引发热烈讨论,互动量已轻松突破万次大关。
豆包大模型1.5正式发布 包括Doubao-1.5-vision-pro等
2025年1月22日,字节跳动旗下的火山引擎宣布正式发布豆包大模型1.5,并全面上线火山方舟平台。此次发布的豆包大模型1.5在多个领域取得了显著的性能提升,综合能力达到全球领先水平,标志着字节跳动在人工智能领域的又一重要突破。
豆包大模型1.5包括多个版本,其中Doubao-1.5-pro在知识、代码、推理、中文等多个权威测评基准上均获得了最佳成绩,综合表现优于GPT-4o、Claude3.5Sonnet等业界一流模型。Doubao-1.5-lite则在轻量级语言模型中表现出色,其性能甚至可以比肩之前的Doubao-pro-32k-0828版本,为用户提供了更高的性价比。
此外,Doubao-1.5-vision-pro在多模态数据合成、动态分辨率、多模态对齐等方面进行了全面升级,增强了视觉推理和细粒度信息理解能力,并在多个权威测评基准上取得领先表现。
3
政策发布
特朗普宣布AI巨型项目:3.6万亿!
在美国白宫举行的新闻发布会上,美国第47任总统唐纳德·特朗普(Donald Trump)宣布,OpenAI、甲骨文和软银将成立一家合资企业Stargate Project,计划未来四年投资高达5000亿美元(折合约3.64万亿人民币)用于建设AI相关基础设施。并创造10万个工作岗位,初始投资预计为1000亿美元。Stargate的合作伙伴凑齐了行业内的顶尖企业。初始股权投资者包括科技巨头软银、甲骨文,顶尖生成式AI创企OpenAI、以及阿布扎比投资公司MGX,实际的业务布局中还有科技巨头Arm、微软、英伟达参与。甲骨文创始人拉里·埃里森(Larry Ellison)透露,Stargate项目的数据中心已经在建设中,目前正在建设的已经有10个。OpenAI CEO萨姆·阿尔特曼(Sam Altman)和软银联合创始人兼CEO孙正义在现场盛赞Stargate项目。阿尔特曼说:“这将是这个时代最重要的项目。”孙正义称:“这是黄金时代的开始。”目前,Stargate中企业的分工已经清晰。
4
会议活动
2025美国CES电子消费展
2025年1月7日至10日美国CES电子消费展在拉斯维加斯举办。CES电子消费展是世界上最大,影响力最广的消费类电子产品年展,也是全球最大的技术产业盛会。
从本届CES的主题「AI Dive In(深入AI)」能看出,AI依旧是展会绝对主角。涵盖机器人、消费电子、自动驾驶、智能家居等一系列AI应用。
本届CES大会我们看到“万物终端皆可AI”的潜力,AI能力与成熟硬件组合落地成为行业大趋势。除了AI PC、AI手机、AI眼镜之外,大量AI宠物玩具、教育硬件、智能家居产品也十分抢眼。
开展最火爆的莫过于英伟达黄教主的重磅演讲,除了英伟达的产品发布,更重要的是揭示了AI发展对于人类生活与工作的重大影响,其中包括了AI Agent大规模商业应用落地和可期待的Physical AI的未来。
越来越多的车企和生态链企业都开始把CES作为展示自己科技含量的重要秀场。今年中国的极氪、长城汽车进行了参展和重要的技术发布,宝马、丰田、本田等车企也参加了,包括博世、法雷奥、IAV、Mobileye等在内的全球供应商,和来自中国本土的华阳、速腾聚创、黑芝麻、禾赛、中科创达等科技公司也都进行了展出。