43国登顶:见证Deepseek这家中国AI公司的出圈时刻

查了一下,我是在去年9月开始注册使用Deepseek的。当时最大的感受是它的性价比实在太高了 - 每百万token才收费2元人民币。但很长一段时间里,Deepseek都只在我们AI爱好者/从业者的小圈子里流传。

然而短短几个月后的今天,情况发生了不可思议的变化,甚至比我之前写过的小红书的美国登顶应用市场的案例更富有戏剧性~

一个意想不到的爆发

截至1月27日,Deepseek的应用已经在全球43个国家和地区的应用商店登顶第一,另外还在116个国家和地区进入前十。从美国到英国,从澳大利亚到尼日利亚,这个来自国内的AI应用正在创造一个前所未有的记录。

更惊人的是网站流量数据:仅在1月24日,deepseek.com的访问量就达到了620万(估计今天数据至少还要再翻5-10倍),比一个月前翻了整整10倍。在换个角度从Google Trends的对比数据来看,如果对比的是大模型三剑客之一的Claude,Deepseek的搜索热度从1月23号就开始反超,到现在已经是远远拉开。

这种突然的流量激增甚至导致他们的服务一度不太稳定 - 很明显,连Deepseek自己都没预料到会有如此汹涌的用户热情。

为什么是Deepseek?

在回答这个问题之前,我们需要了解这家公司的与众不同之处。

Deepseek由梁文峰创立于2023年。作为国内最大量化交易公司幻方量化的创始人,梁文峰早在2008年就开始探索机器学习在量化交易中的应用。但有趣的是,当他创立Deepseek时,采取了一条与主流完全不同的路径。

首先是团队和文化层面。Deepseek的团队规模不到200人,而且主要由清华、北大等顶尖高校的应届毕业生构成,鲜有海外背景。小而精、年轻化、研究导向这样的团队结构更像是一个大学实验室,而不是典型的科技公司。这种选择让公司充满了创新活力,没有太多既有思维的束缚。

其次是技术路线。不同于其他科技巨头要么忙于商业化变现或者是建造更大更贵的数据中心,Deepseek选择专注于底层模型的研发,而且在优化架构上下了大功夫,以更少的资源实现更多的功能。这种定力在当前风口浪尖的AI领域实属罕见。

技术突破的背后

Deepseek的爆发源于两个重要突破:V3和R1模型。

在2024年12月推出的V3模型,其表现与GPT-4o和Claude 3.5 Sonnet相当。技术上采用了一种叫”混合专家”(MoE)的创新架构 - 这就像是把一个大型专家团队分成了多个小组,每个小组专攻不同领域。当需要解决具体问题时,只调动相关领域的专家,而不是整个团队都出动。

具体来说,虽然V3模型总共有6710亿个参数(相当于6710亿个微型”专家”),但处理任务时只需要激活其中的很少一部分就行了。这种”按需调用”的方式让模型既保持了强大的能力,又大幅降低了运行成本。更令人惊讶的是,整个训练过程只花费了558万美元。这个成本效率,足以让任何AI研究者惊叹 – 要知道,过往大家的认知都是要训练一个顶级AI模型至少需要十倍以上的投入。

想象一下,这就像是把一个原本需要数千人同时工作的大公司,改造成了一个只需要几百人就能高效运转的精简团队,却能完成同样甚至更好的工作(有趣的是,Deepseek整个团队不到200人,约是OpenAI人数的十分之一…)。这不仅节省了成本,更重要的是提高了效率。这种创新方式,在当前动辄烧钱的AI领域显得尤为难能可贵。

而在1月发布的R1模型,更是在推理能力上达到了一个新的高度。该模型在数学、代码和推理任务上的性能可与目前全球最聪明的AI - OpenAI的o1模型媲美。值得注意的是,DeepSeek-R1在后训练阶段大规模应用了强化学习技术,在仅有极少标注数据的情况下,大幅提升了模型的推理能力。此外,DeepSeek将R1的模型权重全部公开,首创了开源模型能够和闭源模型达到同一起跑线的时刻。

业界的震撼

这种突破引发了全球科技界的强烈反响。

AI领域的顶级科学家、图灵奖得主Yann LeCun评价说:”Deepseek不代表中国AI超越美国,而是开源正超越闭源。”

而著名风险投资人Marc Andreessen更是直截了当地表示:”Deepseek R1是AI的斯普特尼克时刻。”将其比作1957年苏联发射第一颗人造卫星对美国造成的冲击…

一个更大的转折点

但在我看来,Deepseek的意义远不止于技术突破。它可能预示着AI普及的一个重要转折点。

截至目前,尽管AI已经成为热门话题,但真正的普及率其实并不高,无论是在中国还是美国,大多数人对AI的认知仍停留在概念层面,或者只是曾经简单用过一下。但这次Deepseek的爆发性增长,正在改变这一切。

它证明了:

  1. 高质量的AI服务可以做到既开源又平价;
  2. 用户对真正好用的AI产品有着巨大的需求;
  3. 技术创新不一定要依赖庞大的资源投入;

这种示范效应可能会推动更多互联网公司投入AI应用开发,让更多普通用户真正开始使用AI工具。这才是最令人期待的改变。

未来已来

从我接触Deepseek的这几个月,特别是见证了这波爆发性增长,让我越发确信:AI的未来不会由少数科技巨头垄断,而是会在开放、协作的环境中不断演进。

Deepseek的成功让我们看到,一个更开放、更普及、更平民化的AI时代,可能比我们想象的来得更快。