一个春节档,火的不止是哪吒2,国产大模型DeepSeek也成功登顶全球AI话题榜,夸赞与诋毁带来大规模访问,导致DeepSeek在使用时频繁出现服务器繁忙的情况,于是2月份开始,国产芯片厂商们的应援来了,随手一扒,都挺厉害!

即梦潦草生成,模拟国产芯片厂们给DeepSeek“浴霸式”应援
1、华为昇腾平台
2月1日,华为云与硅基流动联合首发并上线基于华为云昇腾云服务的DeepSeek R1/V3推理服务。
2月4日,DeepSeek R1、V3、V2、Janus – Pro模型正式上线昇腾社区,支持一键获取,在昇腾硬件平台上可开箱即用,实现推理快速部署。同一天,潞晨科技携手华为昇腾,联合发布了基于昇腾算力的DeepSeek R1系列推理API,及云镜像服务。
2月6日,百信信息凭借自主研发的百信恒山326TA服务器,实现昇腾算力与DeepSeek系列模型的推理适配优化。
华为昇腾平台
基于昇腾系列AI处理器和基础软件构建的全栈AI计算基础设施。昇腾系列处理器基于华为自研的达芬奇架构,专为AI计算加速设计,主要产品包括:面向云端训练,支持320TFLOPS的半精度算力的昇腾910,适用于边缘计算和移动端设备,功耗低,支持140Tops的AI算力的昇腾310。
2、沐曦
2月2日,开源中国推出的开源人工智能平台Gitee AI宣布上线1.5B、7B、14B、32B四个规模的DeepSeek R1模型并均部署在国产沐曦曦云GPU上。
2月5日,确认DeepSeek-V3全精度满血版(671B)可以成功运行在沐曦训推一体GPU上,联想还联合沐曦发布基于DeepSeek大模型的首个国产一体机解决方案。
沐曦集成电路(上海)有限公司
2020年9月14日成立,是一家专注为异构计算提供全栈GPU芯片及解决方案的高科技企业,已推出包括用于智算推理的曦思®N系列GPU产品、用于通用计算的曦云®C系列GPU产品,以及用于图形渲染的曦彩®G系列GPU产品。其核心技术团队基本来自AMD,创始人、CEO陈维良为清华大学微电子学研究所硕士,曾任AMD全球GPU SoC设计总负责人、通用GPU MI产品线设计总负责人。沐曦投资方包括浦东资本、红杉中国、经纬创投、上海科创基金、联想创投及招商局资本等。2024年8月,沐曦完成B++轮融资,当时企业估值100亿元。
3、天数智芯
2月4日,天数智芯与Gitee AI联合发布,仅用时一天完成与DeepSeek R1的适配工作,并正式上线多款大模型服务,包括1.5B、7B、14B等规模。此前也完成了与DeepSeek V3 671B模型的适配工作,适配后的模型精度高度对标论文精度。
上海天数智芯半导体有限公司
天数智芯,2015年12月29日成立,是中国通用GPU高端芯片及超级算力系统提供商。其核心产品包括全自研通用GPU训练产品天垓100,智铠100芯片以及系列加速卡,还有支持千亿参数大模型异构算力混合训练的天垓150。2024年5月份消息,天数智芯获得包括中关村科学城、厚朴资本、北京金融街资本等共计6轮融资,除去未披露金额,融资金额超过22亿人民币,市场估值约150亿元。
4、摩尔线程
2月4日,摩尔线程宣布快速实现DeepSeek R1蒸馏模型推理服务在摩尔线程夸娥(KUAE)GPU智算集群上的高效部署,即将开放夸娥GPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。用户也可基于摩尔线程MTT S80和MTT S4000显卡进行DeepSeek-R1蒸馏模型的推理部署。
摩尔线程智能科技(北京)有限责任公司
2020年10月成立,是一家以全功能GPU芯片设计为主的集成电路高科技公司。摩尔线程核心创始团队也大多来自英伟达。创始人兼CEO张建中曾在英伟达工作近20年,担任全球副总裁、中国区总经理。核心产品包括MTT S系列GPU,全国产千卡千亿模型训练平台夸娥智算集群等。目前已知摩尔线程已完成六轮融资,融资金额数十亿元,投资方包括深创投、红杉中国、字节跳动、腾讯投资等。截至2024年11月,摩尔线程的估值已达到255亿元人民币。
5、海光信息
2月4日,海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU(深度计算单元)的适配,并正式上线。用户可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,或直接登录[www.sourcefind.cn]搜索“DeepSeek”,即可基于DCU平台快速部署和使用相关模型。
海光信息技术股份有限公司
2014年10月24日在天津成立,是一家专注于高端处理器研发的集成电路设计企业。产品线主要包括海光通用处理器(CPU)和海光协处理器(DCU)两大系列。2022年8月海光信息正式在科创板上市,包括中科曙光、成都国资等为公司股东,为公司发展提供资金和资源支持。
6、壁仞科技
2月5日,AI芯片独角兽壁仞科技,宣布壁仞AI算力平台正式上线DeepSeek R1蒸馏模型推理服务,开发者可云端体验1.5B、7B、8B、14B、32B、70B全系列模型服务。该服务零部署成本,可多场景覆盖。
上海壁仞科技股份有限公司
2019年9月成立,是一家专注于研发原创性通用计算体系的高科技企业。核心产品主要包括面向大型数据中心 的BR100系列通用GPU芯片,提供强大通用算力的壁砺™系列产品,还有Birensupa™软件开发平台。中国GPU芯片领域重要的“独角兽”企业,壁仞科技目前已完成多轮融资,公开融资总额超过50亿元人民币,投资方包括启明创投、IDG资本、华登中国,平安集团、高瓴创投、格力创投、松禾资本、云晖资本、国盛资本、招商局资本等机构。2024年8月接受国泰君安的上市辅导,预计2025年正式IPO。
7、太初元碁
2月5日,太初元碁宣布在太初T100加速卡上仅用2小时便完成DeepSeek R1系列模型的适配工作,快速上线多款大模型服务。DeepSeek – R1系列模型可在太初元碁官网的模型中心获取。
太初(无锡)电子科技有限公司
公司品牌名为太初元碁,2019年11月成立,是国家超级计算无锡中心孵化的高性能人工智能产业化公司。核心团队成员曾主导“神威·太湖之光”超级计算机的研发,具备从设计到产业化的全栈能力。核心产品为自主研发的CPU和加速器系列产品,以及完备的编译器和工具链软件栈。截至2024年,太初元碁已完成多轮融资,投资机构包括青创投、上海宝山国投、信德实业、浙江省金控国资参股平台金蚂投资、霜叶创投等。
8、云天励飞
春节期间,云天励飞芯片团队完成DeepEdge10 “算力积木”芯片平台与DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B大模型的适配,可交付客户使用。DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-70B大模型、DeepSeek V3/R1 671B MoE大模型也在有序适配中。
深圳云天励飞技术股份有限公司
2014年8月成立,2023年4月正式登陆科创板。这是一家专注于人工智能算法、芯片技术及产品研发的高科技企业。核心产品包括DeepEye1000,DeepEdge10系列芯片,“天舟”大模型推理一体机等。
9、燧原科技
2月6日,燧原科技宣布完成对DeepSeek全量模型的高效适配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸馏模型。
上海燧原科技股份有限公司
2018 年 3 月成立,是一家专注人工智能领域云端算力平台的高科技公司。核心产品包括邃思系列芯片,云燧系列加速卡等,其创始人、董事长、CEO赵立东,曾任紫光通信科技集团有限公司副总裁、AMD 计算事业部高级总监。截至2024年,燧原科技完成多轮融资,估值达到160亿元。主要投资方包括国家大基金、腾讯、美图、真格基金、红点中国等,其中腾讯连续投资6轮,成为最大股东,持股比例超过20%。
10、昆仑芯
2月6日,昆仑芯宣布支持DeepSeek模型,助力DeepSeek在智能计算等领域的应用和发展。
昆仑芯(北京)科技有限公司
其前身为百度智能芯片及架构部,CEO欧阳剑,2016年进入百度,负责自动驾驶数据体系架构,自2020年起担任百度公司首席芯片架构师,2021年4月完成独立融资。
11、龙芯中科
2月7日,龙芯中科宣布搭载龙芯3号CPU的设备成功启动运行DeepSeek R1 7B模型,实现本地化部署。龙芯联合太初元碁等产业伙伴,仅用2小时即在太初T100加速卡上完成DeepSeek-R1系列模型的适配工作。
龙芯中科技术股份有限公司
2008年3月成立,由中国科学院计算技术研究所孵化的高科技企业。公司前身为中科院计算所的龙芯项目团队,自2001年开始研发龙芯CPU,是我国最早研制通用CPU的队伍。2022年成功登陆科创板,成为国产CPU第一股。龙芯中科的核心产品包括龙芯系列处理器及配套芯片,主要面向通用信息化和工业嵌入式两大市场方向。龙芯中科的团队由中科院计算所的资深科研人员组成,具备深厚的技术积累和丰富的行业经验。公司董事长胡伟武博士是龙芯项目的创始人之一。
最后
国产芯片厂商与DeepSeek的深度适配,本质上是技术自主与生态共建的双向奔赴。未来,国产芯片的全球化竞争或将聚焦两大方向:其一,以DeepSeek适配经验为蓝本,推动国际主流框架(如PyTorch、TensorFlow)与国产硬件深度绑定,打破CUDA生态的“单向依赖”;其二,通过大模型与芯片的协同创新,在类脑计算、存算一体等前沿领域抢占技术制高点。当昇腾社区的开发者能像调用英伟达GPU一样便捷地使用国产芯片时,中国AI才能真正实现从“借船出海”到“造船出海”的跨越。这场始于模型适配的技术共振,终将奏响国产算力生态的全球化强音。