2024年末重头戏!【算力豹2024年度十大头条文章盘点】——公司篇

导读

在过去的2024年,算力豹支持跟踪算力产业链发展变化,将报道重点放在算力和AI两个热点领域,内容涵盖政策发布、企业新闻、产品更新、会议活动等内容。

通过对2024年报道内容的梳理,并基于阅读数、评论数、转发量、点赞数等数据,我们汇总了2024年算力豹最受关注的报道内容。

文字编辑| 宋雨涵

年度总结报告——公司篇

2024.12.31

1

智谱AI

1

性能比肩GPT-4!智谱AI发布大模型GLM-4

人人能开发

你是否曾因不会编程而放弃将奇思妙想变为应用?现在,AI与大模型让不会写代码的人也能开发应用,通过自然语言与大模型对话即可。

智谱AI在2024年1月16日的技术开放日上发布了第四代基座大模型GLM-4,其性能相比上一代提升近60%,媲美Gemini Ultra和GPT-4,中文能力超越所有竞争对手。GLM-4支持更长上下文,多模态能力增强,推理速度更快,在基础能力、指令跟随能力和对齐能力上均表现出色。

智谱AI还推出了GLM-4 All Tools,可自动理解、规划复杂指令,自由调用网页浏览器、代码解释器和多模态文生图大模型,实现复杂任务。用户即使不会编程,也能通过简单提示词创建自己的GLM智能体,如行程助手等。

智谱AI还宣布推动大模型开源基金,提供卡、现金和免费API tokens,并发起10亿人民币的大模型创业基金。智谱AI正实践着带领国产大模型开启开发者生态,已联合发起多个大模型基金,为高校研究项目提供科研支持。

GLM-4的发布降低了AI大模型的应用门槛,对AI技术在各行业中的普及具有很大价值。智谱AI正在“将算力变成智力,将智力变成生产力”,期待所有研究者和开发者共同探索大模型的未来。

2

英伟达

2

英伟达AI“核弹问世,推理性能提升30倍,

非常非常大!

30年来,人们追求加速运算与AI突破,生成式AI成为当前关键技术,正迈向多模态和视频领域,需更大规模训练。算力市场竞争加剧,英伟达产品不断刷新AI芯片标杆。

2024年03月19日在GTC大会上,英伟达推出新一代AI GPU架构Blackwell及B200、GB200系列,GB200集成了Grace CPU和2个B200GPU,为最强Grace超级芯片。Blackwell架构拥有2080亿晶体管,采用台积电4nm工艺,通过NVLink高速通信,实时运行生成式AI,大型语言模型成本能耗降25倍。GB200采用MCM设计,集成两个GPU,支持800Gb/s超高速网络,液冷机架级系统性能提升30倍。

同时,英伟达发布新一代DGX SuperPOD超级计算机,采用液冷设计,提供11.5 exaflops AI运算能力,可扩展至数万GB200超级芯片,推进大规模生成式AI部署。DGX GB200系统提供144 petaflops AI性能,比上代快15倍。

此外,英伟达还公布人形机器人项目GR00T,展示多个机器人产品,使用数位孪生技术学习动作,提供Robotic Foundation Model加速机器人时代。GR00T基于通用基础模型,能接受多种输入并处理以采取操作。英伟达还开发Jetson Thor计算芯片处理复杂任务。人形机器人赛道火热,黄仁勋称机器人ChatGPT时刻可能到来。

黄仁勋开完GTC发布会,强调需要更大模型和GPU,GB200预计今年发货。英伟达超级芯片、超算、人形机器人等项目发布,使造万亿模型成为可能,开启更大算力AI模型探索。

3

宁畅

3

构筑强大算力,宁畅以全局智算战略发力大模型落地

2024年3月29日,宁畅发布2024年度战略新品及方案,提出通过“全局智算”战略推进大模型落地。该战略包括六“全”特点:全体系、全液冷、全服务、全场景、全行业、全阶段,旨在构建全面的AI支撑能力体系。

全体系涵盖软硬件栈,支持不同级别AI算力;全场景支持大模型开发适配与部署;全液冷覆盖多形态,降低能耗与成本;全行业满足业务需求;全服务提供全时算力服务,包括软硬件交付;全阶段满足大模型开发至部署的全流程需求。

“全局智算”战略包括六层逻辑能力:硬件资源层、集群设计层、软件层、计算能力层、AI中台层、模型优化层及业务层和场景层。宁畅通过优化算力、算子、AI中台及模型,提升AI运算能力和产品使用率。

宁畅首个“AI算力栈”NEX AI Lab在桐乡落成,集成AI计算领域能力,支持大模型落地所需全方位需求。同时,宁畅为某车企打造全面AI体系支撑的自动驾驶系统,提升计算和测试效率,加速新产品上市。

宁畅CEO秦晓宁表示,“全局智算”需生态伙伴互补融合,共同构建能力,推动大模型在各行业落地,加速科技发展,提升人民幸福感。

4

亚马逊云科技

4

亚马逊云科技宣布生成式AI合作伙伴计划

2024亚马逊云科技中国峰会在上海召开,宣布了围绕行业数字化转型与生成式AI创新的战略合作和合作伙伴计划。亚马逊副总裁储瑞松表示,生成式AI时代已到来,亚马逊云科技将加大投入,助力企业加速数字化转型和生成式AI创新。

亚马逊云科技构成“3+1”联盟,为企业提供全方位支持,助力构建和部署生成式AI解决方案。公司将与合作伙伴紧密合作,创新优化产品与服务,支持其方案上架至亚马逊云科技Marketplace,服务中国及全球客户。

峰会宣布“亚马逊云科技生成式AI合作伙伴计划”,旨在助力企业更快应用生成式AI,打造竞争优势。同时推出“亚马逊云科技行业合作伙伴计划”,聚焦八个重点行业,打造和推广基于云的新一代行业解决方案。

亚马逊云科技始终将安全作为最高优先级,为客户提供安全、稳定、可信赖的服务,确保客户专注于业务创新和发展。

5

讯飞星火

5

讯飞星火V4.0全面领先,斩获8项国际权威测试集冠军

2024年6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关应用,显著提升七大核心能力,超越GPT-4 Turbo,在8个国际测试集中夺冠。讯飞星火APP自9月开放以来,安卓下载量达1.31亿次,领跑国内工具类大模型应用。其热门助手功能深受用户喜爱。

发布会上,科大讯飞基于“飞星一号”推出讯飞星火V4.0,全面升级核心能力,超越GPT-4 Turbo,尤其在文本生成、语言理解等方面领先。讯飞星火V4.0在科研、金融等场景应用效果超GPT-4,长文本能力升级,推出溯源功能提升信息准确性。在12项大模型测试中,讯飞星火8项夺冠,巩固国内领先地位。

科大讯飞《多语种智能语音关键技术及产业化》项目获国家科技进步一等奖,星火语音大模型实现多语种多方言免切换识别,超越OpenAI whisper-V3,方言识别效果提升30%。讯飞同传系统灵活应用于多种场景,突破多人混叠语音转写技术,三人同时说话场景下识别准确率高达86%。

星火汽车智能座舱升级,支持多语种多方言自由交互及多情感多模态超拟人交互,科大讯飞语音交互产品国内市场领先,广泛出口全球,为多家车企提供智能化体验。科大讯飞提出云边端、软硬件一体化解决方案,发布机器人超脑平台2.0,支持多模态交互,已有400余家机器人企业采用。

讯飞星火大模型推动行业发展,助力开发者生态繁荣。自V3.5发布以来,5个月内开发者数量增至702万,海外开发者超40万,大模型开发者达57万,共同探索更多场景应用。

6

360

6

36015家大模型,共推革命性AI助手

2024年8月1日,ISC.AI2024峰会上,360创始人周鸿祎宣布与15家国内大模型企业合作,推出通用的“AI助手”,并开放360安全卫士桌面和浏览器入口。合作企业包括智谱、商汤、百川智能等。

这款“AI助手”融合了多种AI技术,提供智能、高效服务,标志着AI领域的又一突破。通过大模型支持,AI助手具备高度个性化和定制化能力,能理解用户习惯和偏好,提供个性化回复和建议,提升用户体验。

市场对“AI助手”反响积极,用户期待其改变工作和生活方式。行业分析人士认为,它可能在智能家居、智能办公等领域掀起热潮,有望成为科技行业标杆产品。

从用户角度看,“AI助手”能高效完成日常任务,提供安全、个性化服务,如自动生成出行路线、预估到达时间,提供办公助手服务,推荐休闲娱乐活动等,全方位提升用户生活质量。

周鸿祎认为,中美大模型差距主要在芯片算力和中文数据质量,但国内算法训练进步迅速。聚集15家厂商能力,综合能力或可超越GPT-4,最终受益者是用户。此举受钉钉启发,钉钉开放场景并选择七家合作伙伴,360则选择尽可能多地聚集合作伙伴。

7

英特尔

7

跨世纪联手!英特尔终于坐不住了,与AMD携手成立

x86生态系统顾问小组

近年来,Arm架构处理器在云服务、移动设备等领域崛起,对x86架构构成竞争压力。英特尔和AMD在联想Tech World上宣布组建x86生态系统咨询小组,以强化x86架构市场地位。英特尔CEO帕特·基辛格表示,x86架构将迎来定制化、扩大化和可拓展化时期,AMD董事长兼CEO苏姿丰称此举将加速计算能力发展。

x86架构由英特尔1978年推出的8086处理器创立,后逐渐演变成行业标准。AMD等公司在不同时期也推出了x86兼容CPU,与英特尔形成双雄争霸格局。历经四十余年发展,x86架构覆盖领域逐渐拓展,但面临Arm架构在移动市场的挑战。

ARM架构于1983年由Acorn电脑公司开始研发,1986年推出ARMv2架构。1991年,Robin Saxby加入ARM并引入IP商业模式,使ARM架构授权给多家公司设计处理器。2007年,iPhone和Android系统的崛起使ARM架构在智能手机市场占据霸主地位。

目前,英特尔x86架构主导计算机、服务器市场,而ARM架构垄断手机市场。两者竞争激烈,代表性事件包括高通尝试打造基于ARM的服务器芯片、苹果转向使用ARM架构自研芯片等。ARM架构在服务器领域的竞争性不敌x86,但在移动设备领域仍具优势。

随着ARM芯片性能崛起,全球PC出货量增长,采用ARM架构的笔记本电脑引领AI笔记本热潮。Counterpoint预测,到2027年,基于ARM架构的PC设备将占据超过25%的市场份额。

面对ARM架构的压力,英特尔与AMD携手成立x86生态系统顾问小组,旨在汇集行业领导者,共同塑造x86架构的未来,推动开发者创新,提升x86产品间的兼容性、可预测性和一致性。

8

高通

8

高通推出骁龙8至尊版,集成全球最快的移动端CPU

骁龙8 Elite是首个采用高通定制Oryon CPU的移动平台,旨在开启终端侧生成式AI新时代,处理多模态AI复杂性,并注重隐私保护。众多OEM厂商将发布搭载该平台的终端。

高通技术公司高级副总裁表示,第二代Oryon CPU首次引入骁龙移动平台,实现性能和能效大幅提升,将变革移动体验,提供个性化多模态生成式AI,支持语音、情境和图像理解,并保护用户隐私。

智谱与高通合作,将GLM-4V端侧视觉大模型适配骁龙8 Elite,推动多模态生成式AI在终端侧部署,实现丰富多模态交互方式。骁龙8 Elite搭载第二代Oryon CPU和Hexagon NPU,终端侧AI能力突破,支持复杂多模态生成式AI用例高效运行。

多模态生成式AI模型利用终端侧传感器数据,打造直观、无缝智能交互体验。骁龙8 Elite深度适配和推理优化,支持实时语音对话、上传照片和视频对话等三种交互方式,应用于家庭、出行、工作和教育等场景。

9

World Labs

9

“AI教母李飞飞创业归来,AI靠单图生成3D世界

生成式AI进入3D化沉浸式新时代

李飞飞的空间智能基于对人类空间认知的深入理解,指准确感受并表现视觉空间的能力,包括三维思考和重现影像。在斯坦福任教时,李飞飞开始研究空间智能,认为其核心在于教会计算机看、学习和行动。

首次面向大众2024年TED演讲中,李飞飞用“猫推杯”图片阐述人类复杂的空间推理能力,目前AI尚不具备。她研究如何让AI理解物体在空间中的位置及其与环境的关系,推动相关系统进化。

技术进展:宝可梦GO团队打造的LGM开启了空间智能新篇章。随后,李飞飞发布首个空间智能项目,仅凭一张图就能生成交互性3D游戏世界。

技术意义与应用:此成果推动计算机视觉和实体智能体发展,实现从2D到3D的跨越,改变电影、游戏等制作方式。目标客户包括游戏开发商和电影制片厂,有助于降低开发成本,实现创意冒险。对专业人士而言,它是与其他AI工具结合创造新工作流的有用工具。

多模态与空间智能的区别:李飞飞和Justin Johnson在专访中表示,空间智能侧重机器对物理世界的感知、推理和交互能力,是AI发展的必然趋势。与语言模型一维表示不同,空间智能需三维表征为核心。算法层面,空间智能提供了新数据处理、输出类型及问题解决途径。

10

Open AI

10

直播整活?OpenAI开启为期12天直播活动

第一天:发布增强推理模型o1正式版以及每月200美元的ChatGPT Pro订阅服务。

第二天:推出强化微调研究项目,实现定制化推理模型。

第三天:文生视频模型Sora正式版亮相。

第四天:编辑协作工具ChatGPT Canvas发布,深度融合写作与编程场景。

第五天:ChatGPT集成Apple Intelligence,支持Siri、写作工具升级和视觉智能能力。

第六天:新增视频输入和实时屏幕共享功能,高级语音模式支持音频输入输出。

第七天:Projects in ChatGPT发布,用于项目管理与写作、文件与数据管理、个性化定制等场景。

第八天:ChatGPT搜索全量上线,支持语音功能。

第九天:发布o1模型API并升级实时API。

第十天:推出可电话直呼的ChatGPT功能。

第十一天:ChatGPT桌面程序推出应用协作功能。

第十二天:新一代推理模型o3及精简版o3-mini发布,更加专注于高性能推理任务