2025年开年继续奉上！【算力豹2024年度十大头条文章盘点】—

导读

在过去的2024年，算力豹支持跟踪算力产业链发展变化，将报道重点放在算力和AI两个热点领域，内容涵盖政策发布、企业新闻、产品更新、会议活动等内容。

通过对2024年报道内容的梳理，并基于阅读数、评论数、转发量、点赞数等数据，我们汇总了2024年算力豹最受关注的报道内容。

此前算力豹盘点过关于【算力豹2024年度十大头条文章盘点】——公司篇的相关文章，了解相关内容请点击下方链接

2024年末重头戏！【算力豹2024年度十大头条文章盘点】——公司篇

文字编辑｜宋雨涵

年度总结报告—产品篇

2024.1.7

Meta的Llama 3

Llama 3来袭！Meta推“最强开源大模型”

多模态版本很快上线

2024年4月18日，Meta官网宣布Llama 3，已开放80亿和700亿参数版本，提供8k上下文窗口及新信任和安全工具。

Llama 3使用超15T tokens数据训练，数据集比Llama 2大7倍，代码多4倍，通过高质量训练数据和指令微调实现显著提升，在多项基准测试中展现先进性能。Meta开发的高质量人类评估集显示，Llama 3 70B表现优于Claude Sonnet、Mistral Medium、GPT-3.5、Llama 2。Llama 3采用仅解码式Transformer架构，预告将推出超4000亿参数版本。

Meta延续开源路线，与谷歌、Mistral AI等竞争。Llama 3在多项基准上得分超过竞品，Meta计划整合至Facebook、Instagram、WhatsApp等应用，提升AI体验。未来几月，Meta将推出新功能、更长上下文窗口、多模态和增强性能，并分享研究论文。LLaMA 3具有强大自然语言处理能力，有望在智能客服、内容推荐等领域带来商业价值，推动AI技术普及和应用。

OpenAI o1

OpenAI o1模型问世，AI或将像人类一样思考问题

2024年9月13日，OpenAI发布全新模型o1-preview，引发业内关注。o1命名象征AI能力新水平，代表OpenAI最强水平，标志着AI行业新纪元，是通往AGI的重要一步。

o1采用新优化算法和训练数据集，通过强化学习和“思维链”技术，实现复杂推理性能大幅提升，拥有通用推理能力。在基准测试中，o1超越GPT-4o和人类博士水平，尤其在物理、生物、化学问题上表现突出。其背后原理在于强化学习算法，通过思维链完善策略，提高推理能力。

o1模型在回答问题前会花时间“思考问题”，类似人类。通过训练，学会完善思维过程，尝试不同策略，自主识别错误。OpenAI发现新Scaling Law定律，o1性能随强化学习和思考时间投入而提高。

案例分析显示，o1在解决问题时会展开思维链，与自己对话，判断最佳答案。在化学问题中，o1选择多种方案对比，多次纠正后得出正确答案。训练方法源自斯坦福大学的“自学推理”（STaR）技术。

与GPT-4o相比，o1在竞赛编程、数学奥林匹克竞赛和科学问题基准测试中表现优异。内部评估显示，o1在编码、数学和科学领域超越GPT-4o，甚至可能超越人类。《每日经济新闻》测试显示，o1-preview编程和数学推理能力超越OpenAI之前的大模型，且人性化提升。但OpenAI承认，o1在设计、写作等方面不如GPT-4o，无浏览网页或处理文件、图像能力。

由于推理成本增加，o1使用次数受限，每周30条消息。同时推出o1-mini版，每周50条消息限额，且API仅开放给高级用户。o1-preview定价较高，是GPT-4o的3-4倍，面向特定科研用户，速度、成本和应用范围有限。

o1-mini为更高效解决方案，比o1-preview便宜80%，适合需要推理但无需通用世界知识的应用。

总之，OpenAI o1模型在复杂推理任务上超越之前模型，展示AI领域新进展。但高成本和对特定任务优化限制其广泛应用，随技术发展和成本降低，o1模型有望在更多领域发挥重要作用。

英特尔至强6性能核处理器

不断演进与重构后的新品！英特尔发布至强6性能核处理器

将带领数据中心迈向未来

2024年9月26日，英特尔发布至强6性能核处理器（代号Granite Rapids），专为AI、数据分析等计算密集型业务设计。发布会上，英特尔与生态伙伴分享了该处理器在云计算、数据中心架构创新、绿色可持续发展等领域的应用，并进行了联合发布。

至强6处理器采用模块化SoC架构设计，按功能块划分，采用Intel 3制程工艺（计算die）和Intel 7工艺（I/O die）。至强6900P系列包含3个计算die，核心数最多达128个，内存带宽大幅提升，支持DDR5 6400或MRDIMM 8800，每个核心拥有更充裕的内存带宽，有利于核心性能释放。此外，还支持6条UPI 2.0链路、96条PCIe 5.0或64条CXL 2.0通道及504MB L3缓存，AMX加速器引入FP16数据精度，为AI推理和训练提供更多精度选择。

异构计算方面，至强6处理器支持CXL 2.0规范，提高内存利用率，为未来内存扩展和内存池化奠定基础。热功耗方面，至强6900P系列TDP最高达500W，但能耗比和核心密度提升对数据中心更重要。

性能上，至强6处理器性能翻倍，满足从边缘到数据中心再到云环境中的严苛AI挑战。模块化设计提供高度灵活性和可扩展性，为云服务提供商等提供丰富产品系列。

浪潮信息、阿里云、超聚变、火山引擎、新华三等分别展示了基于至强6的新品，推动数据中心算力升级。英特尔还介绍了中国数据中心液冷创新加速计划，旨在降低液冷使用成本、增强可靠性，推动规模化应用。

未来，英特尔将持续推出基于更先进工艺和架构的至强系列处理器，提升性能和能效。计划推出支持DDR5内存和PCIe 5.0或CXL 2.0通道的至强6处理器，进一步提升性能和可扩展性。

豆包视频大模型

视频AI市场风流涌动，字节版 Sora 发布！

实现10秒长度、多主体交互、一致性多镜头

2024年9月25日，豆包视频大模型亮相，展现AI视频生成潜力，备受关注。其突出特点包括：精准语义理解，支持多主体动作交互；强大动态与炫酷运镜，实现多镜头切换；高保真高美感，支持多种风格和比例。

豆包视频大模型应用广泛，如电商营销、动画教育、城市文旅等场景，实现降本提效和创意合规。火山引擎承诺继续推进模型升级迭代，探索更多应用。

数据显示，截至9月，豆包大模型日均tokens使用量超1.3万亿，增长超10倍。未来展望包括语义理解精细化、多模态融合、个性化定制服务以及加强数据安全与隐私保护。

豆包视频大模型作为AI视频生成领域佼佼者，凭借先进技术特点和广泛应用前景，将继续引领行业发展，为人类带来更丰富便捷的视频生成体验。

浪潮信息元脑服务器与

新华三H3C UniServer G7

当智算遇到1024程序员节！

浪潮信息元脑服务器与

新华三H3C UniServer G7新品齐登场

2024年10月24日，元脑®服务器第八代新品与新华三十余款智算新品齐发。浪潮信息发布元脑®第八代算力平台，实现“一机多芯”，支持英特尔®至强®6及AMD EPYC™ 9005系列处理器，性能较上代提升3倍。新华三发布H3C UniServer G7系列、H3C UniStor Polaris X20000系列等智算新品，助力行业智能化转型。

元脑®第八代算力平台，通过开放架构设计，促进多元算力生态进化。在通用算力领域，参与开放计算模组规范(OCM)，发布首款基于OCM的NF3290G8。在AI算力领域，推动OAM规范生态繁荣，发布基于UBB2.0的NF5898G8。平台还实现智能增强，提供全面的平台软件与工具软件支持，提升预警、散热、管理能力。

元脑服务器性能与能效大幅提升，搭载最新英特尔®至强®6处理器，性能提升200%，能效比提升230%以上，适用于多种应用场景。

新华三集团总裁于英涛强调，新华三聚焦“算力×联接”，深化“AI in ALL”，打造开放协同的智算生态，满足不同行业算力需求。H3C UniServer G7系列采用模块化设计，支持高效散热与液冷技术，兼容OAI 2.0标准，打造开放生态。同时，发布内生AI的操作系统磐宁OS与智能管理中枢。

H3C UniServer系列新品包括R4900 G7支持6张双宽GPU，R5500 G7支持万亿参数大模型训练，R5300 G7拥有广泛模型兼容性。H3C UniStor Polaris X20000系列实现性能加速、架构简化与极致稳定。傲飞算力平台融合云原生技术，提升算力资源利用率。

讯飞星火4.0 Turbo

超越GPT-4，联手华为，

科大讯飞全球1024开发者节爆震撼大招

2024年10月24日，科大讯飞全球1024开发者节上，讯飞星火4.0 Turbo发布，多模态视觉交互抢先GPT-4o，超拟人数字人交互引发热烈反响，破国内纪录。本届开发者节以“万物智联生生不息”为主题，科大讯飞展示了在汽车、医疗、教育等领域的领先成果。

讯飞星火4.0 Turbo七大能力超GPT-4 Turbo，数学、代码能力超越GPT-4o，效率提升50%。在技术层面，科大讯飞解决了大模型可信可解释、推广性及个性化问题，实现底层技术突破。星火超拟人数字人实现语义贯穿的“口唇-表情-动作”生成，支持个性创建，已开通内测。

科大讯飞与华为联合研发小艺声音修复，助力特殊人群交流。多语种AI翻译透明屏实现无障碍交流。在教育行业，发布高中数学智能教师系统，推动黑板成为教学AI助手。讯飞AI学习机首发AI作业过滤器，提供习题优先级选项。

讯飞星火医疗大模型2.0升级六大核心场景能力，发布智能医学影像助手，助力影像质控、诊断和读片。同时，发布全谱系全模态医学影像大模型开放合作计划。在司法场景，法律大模型提升庭审笔录、裁判文书编写等效率。政务服务场景，政务大模型覆盖4500多种事项，缩短审核时间，提升登记效率，首发“星火智办一体机”。

科大讯飞作为全球领先的智能语音和人工智能公司，影响力遍及多行业。未来，更多大模型厂商将为全球用户带来创新和价值。

大规模地理空间模型（LGM）

宝可梦GO团队打造全球最强3D地图

150万亿参数开启空间智能新篇章

2024年11月22日，宝可梦GO团队宣布构建出参数规模超150万亿的大规模地理空间模型LGM，标志着空间计算和AR眼镜领域的新时代。LGM作为Niantic视觉定位系统VPS的一部分，通过训练超过5000万个神经网络实现，能够像人类一样理解空间，为AR、机器人、内容创建等领域带来突破。

LGM可视为超级智能地图，具备强大的3D理解能力，能填补地球上尚未全面扫描领域的空白。它使计算机不仅能感知和理解空间，还能与之互动，预示着空间智能将成为未来世界的操作系统。

李飞飞在2024年TED演讲中首提“空间智能”概念，强调AI需具备类似人类的空间推理能力。她团队的多模态感知与推理、动态三维环境的强化学习、大规模物理场景建模等技术，为空间智能打下坚实基础。

LGM利用大规模机器学习理解场景，与全球数百万个场景相连，实现空间理解的飞跃。它能在超过100万个地点操作，每个本地网络为全球大模型贡献理解，包括未扫描地方。基于数十亿张全球图像构建，LGM使计算机能基于位置理解空间、结构和物理交互，实现地理空间智能。

Niantic团队五年构建的VPS，利用单张图像构建3D地图，确定位置和方向。LGM不仅定位，还编码几何、外观和文化信息，启用新方式表示、操控和创造场景。未来智能体系统将相互补充，共同工作理解世界。

LGM作为AI进化里程碑，将在AR技术、游戏、城市规划、物流管理等领域带来变革。同时，需关注其隐私和数据安全问题，采取有效措施保护。

谷歌Gemini

雄心人尽皆知！谷歌Gemini势与GPT-4o“掰手腕”，

谷歌Gemini 2.0于2024年12月12日正式发布！

2024年11月19日，谷歌的Gemini-Exp-1114模型短暂超越GPT-4o，登上Arena榜单榜首，但随后被GPT-4o更新版本夺回。接着，Gemini-Exp-1121再次夺得第一，显示大模型更新迭代迅速。

Gemini-Exp系列的改进主要集中在质量和编码、推理、视觉能力上。这场竞争引出了人工智能基准测试方法可能简化模型评估的问题。传统指标可能夸大感知能力，导致厂商针对特定测试优化模型，而忽视安全性、可靠性和实用性。例如，Gemini-Exp-1121在数学和推理能力上不及前版。

真正的竞争在于开发新框架来评估AI系统的安全性和可靠性。同时，谷歌内部消息透露，Gemini 2.0将于12月第二周发布，带来CoT推理能力、多模态能力增强、上下文窗口扩展和“Project Jarvis”智能代理等新特性。

谷歌还宣布全力推广商用AI Agent，发布激励活动和产品，包括一站式商用生态、AI Agent市场和激励计划。AI Agent市场让用户快速找到并试用AI Agent，简化选择和部署流程。

谷歌在大模型领域的雄心明显，通过不断推出创新模型巩固领先地位。OpenAI、谷歌等科技巨头的竞争，每次重要发布都可能改变行业格局。谷歌年底发布新版Gemini，将为AI竞争掀开新篇章。

昆仑万维“天工大模型4.0”o1

你是o1那我是谁？国产模型“对标”OpenAI！

昆仑万维“天工大模型4.0”o1版登场

2024年11月28日，昆仑万维推出「天工大模型4.0」o1版（Skywork o1），这是国内首款中文逻辑推理o1模型，具备慢思考推理能力，推理能力大幅提升，成为生态位SOTA。

昆仑万维致力于通用人工智能，已完成“算力基础设施—大模型算法—AI应用”全产业链布局，业务涵盖AGI与AIGC、海外信息分发与元宇宙、投资等领域。自2020年起，公司关注大模型和AIGC，构建了多元AI业务矩阵，部分已商业化。

「天工大模型4.0」o1版包括三款：Skywork o1 Open（开源版本，评测指标大幅提升，解锁复杂数学任务）、Skywork o1 Lite（具备完整思考能力，中文支持好，推理速度快）、Skywork o1 Preview（完整版推理模型，思考过程多样且深度，推理质量高）。通过自研多智能体体系、强化学习和Q*算法等技术，模型推理和反思能力得到强化。

相较于此前大模型，Skywork o1在处理复杂问题、思考反思过程、输出答案质量上均有大幅提升。在考研数学题、比大小问题、中文读音陷阱问题、算24点游戏等测试中表现优异，展示了强大的推理和反思能力。

然而，昆仑万维大模型之路面临挑战：高额研发投入导致净亏损持续扩大，人事层面发生变动，市场竞争加剧，商业化落地挑战，需要不断吸引和培养人才，加强技术储备和研发能力。

昆仑万维「天工大模型4.0」o1版的推出是国产AI大模型发展的重要里程碑，为商业化应用和市场拓展奠定坚实基础，但需持续创新迭代，以应对挑战，保持领先地位。

昇思人工智能框架

华为又一大动作！昇思人工智能框架峰会：

开源4年份额达30%，成为发展最快AI框架

2024年12月14日，昇思MindSpore在北京中关村国际创新中心举办人工智能框架峰会。人工智能作为科技革命驱动力，正重塑世界。昇思作为AI框架，加速大模型研发，驱动产业智能化。峰会亮点包括院士致辞、昇思使能模型发布、金奖颁奖等。18家单位发布基于昇思的大模型成果，预测昇思在中国AI框架2024年新增市场份额将达30%。

会上，昇思与多家企业发布基于其框架的大模型，面向多行业推出AI应用，加速数智化升级。华为坚持打造开放计算产业生态，昇思AI框架需具备高效、敏捷、开放的技术与生态能力。华为将持续投入昇思，以开源方式共享技术创新，推动中国AI框架生态发展。

人工智能高速发展，大模型技术演进，昇思持续升级框架架构，提升开发者编程体验，优化大模型训练，强化多模型多任务能力。昇思提供分层分级学习体系，与开发者共成长，坚持开放治理，共治框架未来。昇思与算法专家合作，支持原生大模型孵化，加速成果转化。会上颁发模型开发挑战赛金奖，表彰杰出开发者及布道师。

华为通过开放硬件与软件，助力开发者创新AI模型与应用。昇腾硬件合作伙伴增至50多家，软件合作伙伴增至2000多家，联合开发解决方案近4000个。昇思框架于2020年开源，4年来发展迅速，成为中国发展最快的AI开源框架。昇思框架具备高效、敏捷、开放能力，助力AI模型开发、训练和推理。探索分布式技术，创新多模型多任务引擎，优化快交互能力。

华为致力于构建开放计算产业生态，坚持根源技术创新，将持续投入昇思框架，以开源方式展示创新成果，推动中国AI框架生态健康高速发展。昇思MindSpore框架作为华为AI核心布局，已取得显著成就，未来有望在AI领域发挥更关键作用，推动行业智能化转型。

2025年开年继续奉上！【算力豹2024年度十大头条文章盘点】——产品篇

lixiangjing

相关推荐

近期文章

热门标签