DeepSeek朝硅谷“开了一枪”,登顶苹果中国区免费榜第一宝座,相关微博热搜刷屏

导读

在AI技术日新月异的今天,一场来自东方的技术风暴正席卷全球。中国AI初创公司DeepSeek(深度求索)以惊人的速度崛起,不仅在国际舞台上大放异彩,更在国内市场取得了突破性成就——登顶苹果中国区免费榜第一!这一壮举不仅让DeepSeek成为了微博热搜的焦点,更标志着中国AI技术已经站上了世界之巅。

DeepSeek:中国AI的黑马:

DeepSeek,这家成立不久的AI初创公司,却以惊人的速度在AI领域崭露头角。从DeepSeek-V3到DeepSeek-R1,DeepSeek在短短一个月内相继推出了两款性能卓越的大模型,不仅性能与OpenAI的顶尖模型相媲美,更在成本上实现了极致的优化。DeepSeek-V3的训练成本仅为558万美元,而DeepSeek-R1更是以极低的API调用成本,提供了与OpenAI o1相当的推理能力。

这种“四两拨千斤”的模式,彻底颠覆了人们对AI技术高投入、高产出的固有认知。DeepSeek用实际行动证明,即使在没有尖端芯片和巨额投资的情况下,也能训练出世界一流的AI模型。

文字编辑| 宋雨涵

1

从当初的默默无闻到如今的火出圈

DeepSeek的发展历程

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,自2023年7月17日成立以来,便以创新型科技公司的姿态,专注于先进大语言模型(LLM)及相关技术的研发。去年12月,DeepSeek-V3的横空出世,引起了全球科技界的广泛关注。AI数据服务公司Scale AI的创始人Alexander Wang更是直言,DeepSeek-V3是中国科技界给美国带来的一次深刻反思,他感叹道:“当美国稍作休憩之时,中国(科技界)却马不停蹄,以更低的成本、更快的步伐和更强大的实力迅速崛起。”

紧接着,今年1月20日,DeepSeek又宣布了一个重大消息——正式开源其R1推理模型。据DeepSeek介绍,DeepSeek-R1在后训练阶段创新性地大规模应用了强化学习技术,即便在标注数据极为有限的情况下,也极大地提升了模型的推理能力。在数学、代码编写、自然语言推理等多个领域,其性能已与OpenAI的o1正式版并驾齐驱。

这一模型的发布,迅速在海外AI圈内引起了轩然大波,众多科技界大佬纷纷加入讨论。英伟达高级研究科学家Jim Fan就在其个人社交平台上公开表示:“我们正站在一个历史性的转折点上:一家非美国的公司,正在继续践行OpenAI的初衷——通过真正开放的前沿研究,为全人类带来福祉。这看似不合常理,但往往最引人入胜的结局,正是那些最出乎意料的。”

不断引发业界关注

真正让Deepseek在AI界出圈的,是其在2024年5月开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一,DeepSeek由此被称作“价格屠夫”、“AI界的拼多多”。

随后的2024年下半年,这家公司还先后发布了DeepSeek R1-lite-preview和DeepSeek-V3。到了2025年推出的R1模型,在数学能力测试中,该模型在MATH基准测试上达到了77.5%的准确率,与OpenAI的o1不相上下;在编程领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。而这一切,是在不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。

2

为什么是Deepseek?

纯粹强化学习,也许才是通向AGI的意外捷径

和上次不同的是,这次推出的新模型DeepSeek-R1不仅成本低,更是在技术上有了大福提升。

而且,它还是一个开源模型。

这款新模型延续了其高性价比的优势,仅用十分之一的成本就达到了GPT-o1级别的表现。

所以,很多业内人士甚至喊出了“DeepSeek接班OpenAI”的口号。

比如,前Meta AI工作人员、知名AI论文推特作者Elvis就强调,DeepSeek-R1的论文堪称瑰宝,因为它探索了提升大语言模型推理能力的多种方法,并发现了其中更明确的涌现特性。


另一位AI圈大V Yuchen Jin则认为,DeepSeek-R1论文中提出的,模型利用纯RL方法引导其自主学习和反思推理这一发现,意义非常重大。

英伟达GEAR Lab项目负责人Jim Fan在推特中也提到了,DeepSeek-R1用通过硬编码规则计算出的真实奖励,而避免使用任何 RL 容易破解的学习奖励模型。这使得模型产生了自我反思与探索行为的涌现。
Jim Fan 甚至认为,它们做了OpenAI本来应该做的事,开源。

3

开源吸引全球顶尖专家,共建共创

技术专家的加入

Deepseek的技术团队汇聚了众多顶尖的技术专家。他们不仅在模型架构、算法优化等方面具有深厚的造诣,更在推动技术创新和应用落地方面发挥着关键作用。例如,高华佐、曾旺丁等专家在DeepSeek-V2的MLA架构创新上做出了重要贡献,为模型的性能提升奠定了坚实基础。

学术界的支持

Deepseek的开源战略也得到了学术界的广泛支持。斯坦福、MIT等顶尖学府将Deepseek列为首选研究工具,吸引了大量学术研究者参与其中。他们通过发表论文、分享研究成果等方式,为Deepseek的技术发展和应用推广提供了有力支持。

产业界的合作

此外,Deepseek还与众多产业界伙伴建立了紧密的合作关系。这些合作伙伴不仅为Deepseek提供了丰富的应用场景和测试环境,还通过共同研发、市场推广等方式,推动了Deepseek技术的商业化进程。

结语

1月27日,DeepSeek应用成功登顶苹果中国区免费榜第一,这一成就不仅是对DeepSeek技术实力的认可,更是对其市场影响力的肯定。在短短的时间内,DeepSeek凭借其出色的性能和亲民的价格,赢得了大量用户的青睐。

这一成就的背后,是DeepSeek团队对技术的极致追求和对用户体验的深刻理解。DeepSeek不仅提供了强大的AI功能,更在用户体验上做到了极致。无论是简洁明了的界面设计,还是流畅高效的操作体验,都让DeepSeek成为了用户心中的首选。

展望未来,DeepSeek将继续秉承“硬核技术创新”的理念,不断推出更多性能卓越、成本亲民的AI产品。同时,DeepSeek也将积极拥抱开源文化,与全球开发者共同推动AI技术的进步和发展。