2025年开年继续奉上!【算力豹2024年度十大头条文章盘点】——产品篇

 导读

在过去的2024年,算力豹支持跟踪算力产业链发展变化,将报道重点放在算力和AI两个热点领域,内容涵盖政策发布、企业新闻、产品更新、会议活动等内容。

通过对2024年报道内容的梳理,并基于阅读数、评论数、转发量、点赞数等数据,我们汇总了2024年算力豹最受关注的报道内容。

此前算力豹盘点过关于【算力豹2024年度十大头条文章盘点】——公司篇的相关文章,了解相关内容请点击下方链接

2024年末重头戏!【算力豹2024年度十大头条文章盘点】——公司篇

文字编辑| 宋雨涵

年度总结报告—产品篇

2024.1.7

1

Meta的Llama 3

1

Llama 3来袭!Meta最强开源大模型

多模态版本很快上线

2024年4月18日,Meta官网宣布Llama 3,已开放80亿和700亿参数版本,提供8k上下文窗口及新信任和安全工具。

Llama 3使用超15T tokens数据训练,数据集比Llama 2大7倍,代码多4倍,通过高质量训练数据和指令微调实现显著提升,在多项基准测试中展现先进性能。Meta开发的高质量人类评估集显示,Llama 3 70B表现优于Claude Sonnet、Mistral Medium、GPT-3.5、Llama 2。Llama 3采用仅解码式Transformer架构,预告将推出超4000亿参数版本。

Meta延续开源路线,与谷歌、Mistral AI等竞争。Llama 3在多项基准上得分超过竞品,Meta计划整合至Facebook、Instagram、WhatsApp等应用,提升AI体验。未来几月,Meta将推出新功能、更长上下文窗口、多模态和增强性能,并分享研究论文。LLaMA 3具有强大自然语言处理能力,有望在智能客服、内容推荐等领域带来商业价值,推动AI技术普及和应用。

2

OpenAI o1

2

OpenAI o1模型问世,AI或将像人类一样思考问题

2024年9月13日,OpenAI发布全新模型o1-preview,引发业内关注。o1命名象征AI能力新水平,代表OpenAI最强水平,标志着AI行业新纪元,是通往AGI的重要一步。

o1采用新优化算法和训练数据集,通过强化学习和“思维链”技术,实现复杂推理性能大幅提升,拥有通用推理能力。在基准测试中,o1超越GPT-4o和人类博士水平,尤其在物理、生物、化学问题上表现突出。其背后原理在于强化学习算法,通过思维链完善策略,提高推理能力。

o1模型在回答问题前会花时间“思考问题”,类似人类。通过训练,学会完善思维过程,尝试不同策略,自主识别错误。OpenAI发现新Scaling Law定律,o1性能随强化学习和思考时间投入而提高。

案例分析显示,o1在解决问题时会展开思维链,与自己对话,判断最佳答案。在化学问题中,o1选择多种方案对比,多次纠正后得出正确答案。训练方法源自斯坦福大学的“自学推理”(STaR)技术。

与GPT-4o相比,o1在竞赛编程、数学奥林匹克竞赛和科学问题基准测试中表现优异。内部评估显示,o1在编码、数学和科学领域超越GPT-4o,甚至可能超越人类。《每日经济新闻》测试显示,o1-preview编程和数学推理能力超越OpenAI之前的大模型,且人性化提升。但OpenAI承认,o1在设计、写作等方面不如GPT-4o,无浏览网页或处理文件、图像能力。

由于推理成本增加,o1使用次数受限,每周30条消息。同时推出o1-mini版,每周50条消息限额,且API仅开放给高级用户。o1-preview定价较高,是GPT-4o的3-4倍,面向特定科研用户,速度、成本和应用范围有限。

o1-mini为更高效解决方案,比o1-preview便宜80%,适合需要推理但无需通用世界知识的应用。

总之,OpenAI o1模型在复杂推理任务上超越之前模型,展示AI领域新进展。但高成本和对特定任务优化限制其广泛应用,随技术发展和成本降低,o1模型有望在更多领域发挥重要作用。

3

英特尔至强6性能核处理器

3

不断演进与重构后的新品!英特尔发布至强6性能核处理器

将带领数据中心迈向未来

2024年9月26日,英特尔发布至强6性能核处理器(代号Granite Rapids),专为AI、数据分析等计算密集型业务设计。发布会上,英特尔与生态伙伴分享了该处理器在云计算、数据中心架构创新、绿色可持续发展等领域的应用,并进行了联合发布。

至强6处理器采用模块化SoC架构设计,按功能块划分,采用Intel 3制程工艺(计算die)和Intel 7工艺(I/O die)。至强6900P系列包含3个计算die,核心数最多达128个,内存带宽大幅提升,支持DDR5 6400或MRDIMM 8800,每个核心拥有更充裕的内存带宽,有利于核心性能释放。此外,还支持6条UPI 2.0链路、96条PCIe 5.0或64条CXL 2.0通道及504MB L3缓存,AMX加速器引入FP16数据精度,为AI推理和训练提供更多精度选择。

异构计算方面,至强6处理器支持CXL 2.0规范,提高内存利用率,为未来内存扩展和内存池化奠定基础。热功耗方面,至强6900P系列TDP最高达500W,但能耗比和核心密度提升对数据中心更重要。

性能上,至强6处理器性能翻倍,满足从边缘到数据中心再到云环境中的严苛AI挑战。模块化设计提供高度灵活性和可扩展性,为云服务提供商等提供丰富产品系列。

浪潮信息、阿里云、超聚变、火山引擎、新华三等分别展示了基于至强6的新品,推动数据中心算力升级。英特尔还介绍了中国数据中心液冷创新加速计划,旨在降低液冷使用成本、增强可靠性,推动规模化应用。

未来,英特尔将持续推出基于更先进工艺和架构的至强系列处理器,提升性能和能效。计划推出支持DDR5内存和PCIe 5.0或CXL 2.0通道的至强6处理器,进一步提升性能和可扩展性。

4

豆包视频大模型

4

视频AI市场风流涌动,字节版 Sora 发布!

实现10秒长度、多主体交互、一致性多镜头

2024年9月25日,豆包视频大模型亮相,展现AI视频生成潜力,备受关注。其突出特点包括:精准语义理解,支持多主体动作交互;强大动态与炫酷运镜,实现多镜头切换;高保真高美感,支持多种风格和比例。

豆包视频大模型应用广泛,如电商营销、动画教育、城市文旅等场景,实现降本提效和创意合规。火山引擎承诺继续推进模型升级迭代,探索更多应用。

数据显示,截至9月,豆包大模型日均tokens使用量超1.3万亿,增长超10倍。未来展望包括语义理解精细化、多模态融合、个性化定制服务以及加强数据安全与隐私保护。

豆包视频大模型作为AI视频生成领域佼佼者,凭借先进技术特点和广泛应用前景,将继续引领行业发展,为人类带来更丰富便捷的视频生成体验。

5

浪潮信息元脑服务器与

新华三H3C UniServer G7

5

当智算遇到1024程序员节!

浪潮信息元脑服务器与

新华三H3C UniServer G7新品齐登场

2024年10月24日,元脑®服务器第八代新品与新华三十余款智算新品齐发。浪潮信息发布元脑®第八代算力平台,实现“一机多芯”,支持英特尔®至强®6及AMD EPYC™ 9005系列处理器,性能较上代提升3倍。新华三发布H3C UniServer G7系列、H3C UniStor Polaris X20000系列等智算新品,助力行业智能化转型。

元脑®第八代算力平台,通过开放架构设计,促进多元算力生态进化。在通用算力领域,参与开放计算模组规范(OCM),发布首款基于OCM的NF3290G8。在AI算力领域,推动OAM规范生态繁荣,发布基于UBB2.0的NF5898G8。平台还实现智能增强,提供全面的平台软件与工具软件支持,提升预警、散热、管理能力。

元脑服务器性能与能效大幅提升,搭载最新英特尔®至强®6处理器,性能提升200%,能效比提升230%以上,适用于多种应用场景。

新华三集团总裁于英涛强调,新华三聚焦“算力×联接”,深化“AI in ALL”,打造开放协同的智算生态,满足不同行业算力需求。H3C UniServer G7系列采用模块化设计,支持高效散热与液冷技术,兼容OAI 2.0标准,打造开放生态。同时,发布内生AI的操作系统磐宁OS与智能管理中枢。

H3C UniServer系列新品包括R4900 G7支持6张双宽GPU,R5500 G7支持万亿参数大模型训练,R5300 G7拥有广泛模型兼容性。H3C UniStor Polaris X20000系列实现性能加速、架构简化与极致稳定。傲飞算力平台融合云原生技术,提升算力资源利用率。

6

讯飞星火4.0 Turbo

6

超越GPT-4,联手华为,

科大讯飞全球1024开发者节爆震撼大招

2024年10月24日,科大讯飞全球1024开发者节上,讯飞星火4.0 Turbo发布,多模态视觉交互抢先GPT-4o,超拟人数字人交互引发热烈反响,破国内纪录。本届开发者节以“万物智联 生生不息”为主题,科大讯飞展示了在汽车、医疗、教育等领域的领先成果。

讯飞星火4.0 Turbo七大能力超GPT-4 Turbo,数学、代码能力超越GPT-4o,效率提升50%。在技术层面,科大讯飞解决了大模型可信可解释、推广性及个性化问题,实现底层技术突破。星火超拟人数字人实现语义贯穿的“口唇-表情-动作”生成,支持个性创建,已开通内测。

科大讯飞与华为联合研发小艺声音修复,助力特殊人群交流。多语种AI翻译透明屏实现无障碍交流。在教育行业,发布高中数学智能教师系统,推动黑板成为教学AI助手。讯飞AI学习机首发AI作业过滤器,提供习题优先级选项。

讯飞星火医疗大模型2.0升级六大核心场景能力,发布智能医学影像助手,助力影像质控、诊断和读片。同时,发布全谱系全模态医学影像大模型开放合作计划。在司法场景,法律大模型提升庭审笔录、裁判文书编写等效率。政务服务场景,政务大模型覆盖4500多种事项,缩短审核时间,提升登记效率,首发“星火智办一体机”。

科大讯飞作为全球领先的智能语音和人工智能公司,影响力遍及多行业。未来,更多大模型厂商将为全球用户带来创新和价值。

7

大规模地理空间模型(LGM)

7

宝可梦GO团队打造全球最强3D地图

150万亿参数开启空间智能新篇章

2024年11月22日,宝可梦GO团队宣布构建出参数规模超150万亿的大规模地理空间模型LGM,标志着空间计算和AR眼镜领域的新时代。LGM作为Niantic视觉定位系统VPS的一部分,通过训练超过5000万个神经网络实现,能够像人类一样理解空间,为AR、机器人、内容创建等领域带来突破。

LGM可视为超级智能地图,具备强大的3D理解能力,能填补地球上尚未全面扫描领域的空白。它使计算机不仅能感知和理解空间,还能与之互动,预示着空间智能将成为未来世界的操作系统。

李飞飞在2024年TED演讲中首提“空间智能”概念,强调AI需具备类似人类的空间推理能力。她团队的多模态感知与推理、动态三维环境的强化学习、大规模物理场景建模等技术,为空间智能打下坚实基础。

LGM利用大规模机器学习理解场景,与全球数百万个场景相连,实现空间理解的飞跃。它能在超过100万个地点操作,每个本地网络为全球大模型贡献理解,包括未扫描地方。基于数十亿张全球图像构建,LGM使计算机能基于位置理解空间、结构和物理交互,实现地理空间智能。

Niantic团队五年构建的VPS,利用单张图像构建3D地图,确定位置和方向。LGM不仅定位,还编码几何、外观和文化信息,启用新方式表示、操控和创造场景。未来智能体系统将相互补充,共同工作理解世界。

LGM作为AI进化里程碑,将在AR技术、游戏、城市规划、物流管理等领域带来变革。同时,需关注其隐私和数据安全问题,采取有效措施保护。

8

谷歌Gemini

8

雄心人尽皆知!谷歌Gemini势与GPT-4o“掰手腕

谷歌Gemini 2.020241212日正式发布!

2024年11月19日,谷歌的Gemini-Exp-1114模型短暂超越GPT-4o,登上Arena榜单榜首,但随后被GPT-4o更新版本夺回。接着,Gemini-Exp-1121再次夺得第一,显示大模型更新迭代迅速。

Gemini-Exp系列的改进主要集中在质量和编码、推理、视觉能力上。这场竞争引出了人工智能基准测试方法可能简化模型评估的问题。传统指标可能夸大感知能力,导致厂商针对特定测试优化模型,而忽视安全性、可靠性和实用性。例如,Gemini-Exp-1121在数学和推理能力上不及前版。

真正的竞争在于开发新框架来评估AI系统的安全性和可靠性。同时,谷歌内部消息透露,Gemini 2.0将于12月第二周发布,带来CoT推理能力、多模态能力增强、上下文窗口扩展和“Project Jarvis”智能代理等新特性。

谷歌还宣布全力推广商用AI Agent,发布激励活动和产品,包括一站式商用生态、AI Agent市场和激励计划。AI Agent市场让用户快速找到并试用AI Agent,简化选择和部署流程。

谷歌在大模型领域的雄心明显,通过不断推出创新模型巩固领先地位。OpenAI、谷歌等科技巨头的竞争,每次重要发布都可能改变行业格局。谷歌年底发布新版Gemini,将为AI竞争掀开新篇章。

9

昆仑万维“天工大模型4.0”o1

9

你是o1那我是谁?国产模型对标”OpenAI

昆仑万维天工大模型4.0”o1版登场

2024年11月28日,昆仑万维推出「天工大模型4.0」o1版(Skywork o1),这是国内首款中文逻辑推理o1模型,具备慢思考推理能力,推理能力大幅提升,成为生态位SOTA。

昆仑万维致力于通用人工智能,已完成“算力基础设施—大模型算法—AI应用”全产业链布局,业务涵盖AGI与AIGC、海外信息分发与元宇宙、投资等领域。自2020年起,公司关注大模型和AIGC,构建了多元AI业务矩阵,部分已商业化。

「天工大模型4.0」o1版包括三款:Skywork o1 Open(开源版本,评测指标大幅提升,解锁复杂数学任务)、Skywork o1 Lite(具备完整思考能力,中文支持好,推理速度快)、Skywork o1 Preview(完整版推理模型,思考过程多样且深度,推理质量高)。通过自研多智能体体系、强化学习和Q*算法等技术,模型推理和反思能力得到强化。

相较于此前大模型,Skywork o1在处理复杂问题、思考反思过程、输出答案质量上均有大幅提升。在考研数学题、比大小问题、中文读音陷阱问题、算24点游戏等测试中表现优异,展示了强大的推理和反思能力。

然而,昆仑万维大模型之路面临挑战:高额研发投入导致净亏损持续扩大,人事层面发生变动,市场竞争加剧,商业化落地挑战,需要不断吸引和培养人才,加强技术储备和研发能力。

昆仑万维「天工大模型4.0」o1版的推出是国产AI大模型发展的重要里程碑,为商业化应用和市场拓展奠定坚实基础,但需持续创新迭代,以应对挑战,保持领先地位。

10

昇思人工智能框架

10

华为又一大动作!昇思人工智能框架峰会:

开源4年份额达30%,成为发展最快AI框架

2024年12月14日,昇思MindSpore在北京中关村国际创新中心举办人工智能框架峰会。人工智能作为科技革命驱动力,正重塑世界。昇思作为AI框架,加速大模型研发,驱动产业智能化。峰会亮点包括院士致辞、昇思使能模型发布、金奖颁奖等。18家单位发布基于昇思的大模型成果,预测昇思在中国AI框架2024年新增市场份额将达30%。

会上,昇思与多家企业发布基于其框架的大模型,面向多行业推出AI应用,加速数智化升级。华为坚持打造开放计算产业生态,昇思AI框架需具备高效、敏捷、开放的技术与生态能力。华为将持续投入昇思,以开源方式共享技术创新,推动中国AI框架生态发展。

人工智能高速发展,大模型技术演进,昇思持续升级框架架构,提升开发者编程体验,优化大模型训练,强化多模型多任务能力。昇思提供分层分级学习体系,与开发者共成长,坚持开放治理,共治框架未来。昇思与算法专家合作,支持原生大模型孵化,加速成果转化。会上颁发模型开发挑战赛金奖,表彰杰出开发者及布道师。

华为通过开放硬件与软件,助力开发者创新AI模型与应用。昇腾硬件合作伙伴增至50多家,软件合作伙伴增至2000多家,联合开发解决方案近4000个。昇思框架于2020年开源,4年来发展迅速,成为中国发展最快的AI开源框架。昇思框架具备高效、敏捷、开放能力,助力AI模型开发、训练和推理。探索分布式技术,创新多模型多任务引擎,优化快交互能力。

华为致力于构建开放计算产业生态,坚持根源技术创新,将持续投入昇思框架,以开源方式展示创新成果,推动中国AI框架生态健康高速发展。昇思MindSpore框架作为华为AI核心布局,已取得显著成就,未来有望在AI领域发挥更关键作用,推动行业智能化转型。