硅谷有两个Shunyu Yao,他们眼中的 AI 下半场完全不同
不久前,腾讯首席 AI 科学家姚顺雨在一场公开对话中说:「AI 下半场这个词,正在被滥用。」
这个词其实是他自己在去年的博客里提出的。他的定义很清晰:过去 AI 行业的核心是寻找解决问题的有效方法,现在方法论已经趋于成熟,找到真正有价值的问题反而变得更困难了。从找方法到找问题,这就是他眼中的上下半场分界线。
但硅谷还有另一个 Shunyu Yao|姚顺宇。
如果你关注 AI 圈,大概率听说过「硅谷有两个 Shunyu Yao」这个梗。两人都是清华本科同级,一个学物理(基科班),一个学计算机(姚班);一个去了斯坦福,一个去了普林斯顿,刚好和大家的刻板印象反过来。前者(以下称「DeepMind 姚」)辗转 Anthropic 后加入 Google DeepMind,后者(以下称「腾讯姚」)从 OpenAI 跳槽到腾讯出任首席 AI 科学家。
最近这两位分别接受了深度访谈:DeepMind 姚与张小珺做了一期 4 小时的长播客,腾讯姚则在腾讯 AI 大会上与汤道生进行了公开对话。两段内容叠在一起看,会发现一件很有意思的事:两个同名同龄、背景高度重叠的人,对 AI 行业的判断既有惊人共识,也有根本性的分岔。
这篇文章就来拆解这两段对话的核心观点,看看两个 Shunyu Yao 的 AI 世界观到底在哪里交汇,在哪里分道扬镳。
DeepMind 姚的七个核心判断
这段 4 小时的访谈干货密度极高。以下是我印象最深刻的几个亮点:
1. 模型能力正在均质化,竞争已经变成”下注”
DeepMind 姚非常直接:Gemini、OpenAI 和 Anthropic 三家现在没有谁会真的担心自己追不上对方。
「纸面上大家其实都比较相近。当你去看 SWE-bench,好的会比不好的可能高一个百分点或两个百分点,但其实大家都在 80% 附近。那个附近数字高一点低一点,其实是 Noise,就只是噪声而不是信号。」
但他强调,这不意味着模型之间没有区别。Claude 在通用 Agent 上仍然最强,Gemini 在推理和日常使用上更好,只是这些区别不再能从 Benchmark 上看出来了。
真正的战场已经转移。现在难的不是”怎么做”,而是”做什么”,是在充满不确定性的方向上做出对的洞察和下注。他认为 Anthropic 的核心优势恰恰在于此:技术 Leader 同时是公司 Co-founder,有权力也有能力做出自上而下的下注,一旦看到信号就全力推进。这种组织能力在 OpenAI 做不到(Ilya 走后丧失了技术决策权),在 Google 也做不到(传统上是更自下而上),但它是 Startup 最需要的东西。
2. “有限训练,无限使用”:2026 年最关键的技术赌注
DeepMind 姚目前在 DeepMind 的核心工作之一是 Long Horizon,他的判断是:2026 年将实现”用有限的上下文长度训练,但在使用时呈现出近乎无限的上下文长度”。
这意味着什么?模型可以跟你持续交互,在运行过程中主动丢弃不重要的信息,就像人类的大脑一样。你现在问我昨天晚饭吃了什么,我大概率想不起来,因为这个信息对当前场景不关键,大脑选择遗忘了。
他认为这将直接解锁真正的「个人助手」。不是那种每次对话都从零开始的 ChatBot,而是一个持续积累对你的理解、能够判断什么该记什么该忘的长期伙伴。
3. 只有 Agent + Coding 形成了数据飞轮
谈到 AI 原生场景,DeepMind 姚的判断很冷峻:
「目前除了 Agent + Coding 之外,没有哪个场景是 AI 真正原生的场景变得非常成功了。ChatBot 其实是搜索的一个延伸。」
Coding 之所以跑在最前面,是因为它具备两个别的场景很难同时拥有的特质:反馈信号清晰(代码跑通或跑不通,没有模糊空间)和数据基础充分(GitHub 上几十年积累的高质量代码)。这两件事叠加在一起,让 Coding 成了模型能力最容易快速验证和迭代的场景。
Coding 还有一个额外价值:它是模型使用工具和环境交互的”好的抽象”,在这个场景里积累的经验,理论上可以迁移到更通用的工具使用能力上。
4. AI 是一种高度中心化的技术
「AI 是一个很中心化的技术,它会让少部分人变得更强,但会让大部分人失去他们的独特价值。最后变成的结果可能就是,现在千分之一的人干了过去所有人的工作,拿着现在 100 倍的工资。」
他举了自己的例子:有了 AI 工具后,保守估计 90% 的代码是模型写的。效率提升了 20-50 倍,但工作时间反而变长了,因为开发速度变快后”越试越想试”,可以同时跑好几个想法。对顶尖从业者来说,AI 是效率的放大器;但对于那种”你的经理告诉你实现这个方案下周五之前给我”的工作,他认为”未来可能就不会再存在了”。
(之前我写过当三家高增长公司同时裁员 20%:Cloudflare 用德鲁克回答了”裁谁”,讨论的也是类似的主题。)
5. AI 研究不需要脑子,只需要靠谱
这句话初听很反直觉,但他的论证很有说服力:
「AI 这事本来也不太需要脑子,需要什么?靠谱,做事细,然后对自己做的事负责任。这些都是本科生就能干的活。」
他把当下的 AI 研究比作 17-18 世纪的热力学。那时候理论和实验不分家,大家不理解”热”的微观理论是什么,但不妨碍你有好的经验定律(就像今天的 Scaling Law)。AI 可以做任何你能想到的实验,没有什么根本性的障碍,人类想空脑袋的速度甚至赶不上实验验证的速度。
对人的要求随之改变。不是脑子多聪明,而是能不能系统性地做事。在大规模协作中,一个研究员如果只追求让自己的指标好看,而不去思考这个指标在全局系统中是否真的有意义,就是不合格的。
6. 个人英雄主义已经终结
DeepMind 姚反复强调这一点:
「我觉得大家现在每个人都是冲浪的人,本质上是那个浪,而不是你那个冲浪的人。」
他的推理链是这样的:在 Transformer 范式确定和大尺度 Scaling 开始之后,语言模型的研究就彻底进入了集体主义时代。所谓的技术 Tips 极度依赖每家公司独特的基础设施,脱离系统讨论没有意义。你在 Anthropic 有用的技巧,到 Google 可能完全用不上,因为底层的训练架构都不一样。
他甚至对自己参与的项目(包括 Claude 3.7、Gemini 3 等知名模型)都保持这种态度:「不管是在 Google 还是在 Anthropic,我参与过的任何一个项目,我不参与也一样会发生,效果也不会变差。」
(这跟 AI 行业动辄亿元挖人的现实形成了很有意思的反差。之前我在顶尖 AI 实验室变身体育豪门,重金只为争夺「最强大脑」里讨论过这个现象。DeepMind 姚的回应是:这种炒作”有点过分了”。稀缺性是真的,需要特定环境才能训练出来的人确实不多,但个人对最终结果的贡献被严重高估了。)
7. AI 将在 6-12 个月内实现”自己研究自己”
这是 DeepMind 姚目前最核心的工作方向,ML Coding。就是让 AI 实现一个完整的研究闭环:写代码 → 跑实验 → 分析结果 → 发现问题 → 提出新假设 → 设计新实验。
「AI 自己提高自己,其实已经在发生了。但目前这个链条还没完整。我觉得未来 6 到 12 个月,这条链条可能会慢慢变得完整。」
他认为这对 Google 尤其有价值,因为 Google 不仅做模型训练,还有硬件设计、从硬件到模型的全栈能力。如果这整套东西都能被 AI 加速,将产生巨大的复利效应。
腾讯姚的五个核心判断
相比 DeepMind 姚 4 小时的深度长谈,腾讯姚在 AI 大会上的对话更偏战略层面,但几个核心判断同样值得关注,尤其是作为 DeepMind 姚的对照组来看。
1. “AI 下半场”= 从找方法到找问题
这是腾讯姚最标志性的框架。预训练和后训练技术给了我们一把”万能锤子”,以前做翻译需要翻译模型,下围棋需要围棋模型,但现在一套方法可以解决各种问题。当方法不再是瓶颈,找到值得解决的好问题就成了核心挑战。
这也是他加入腾讯的核心原因:腾讯有海量产品和真实问题场景,而在他的框架里,问题场景的丰富度将决定 AI 下半场的胜负。
2. 模型与产品的 Co-Design 是未来的关键
腾讯姚最强调的一个概念是”协同设计”(Co-Design),即模型团队和产品团队深度融合。他认为 LLM 时代最大的变化是泛化性:要做好代码 Agent,不仅需要代码数据,还需要聊天、搜索、指令遵循、推理等各种通用能力。由此推导出一个结论:拥有体系化产品矩阵的企业会有显著优势。不同产品提供不同维度的数据,这些数据之间可以互相泛化。
3. 刷榜是国内 AI 的一个坏毛病
腾讯姚直言不讳:
「国内现在有一个不好的倾向,就是过度追求刷榜。我们应该实事求是,基于真实的产品和应用场景,构建更贴近实际的评测标准。」
他认为基于真实世界数据的评测有三个核心优势:能发现模型的底线问题,能理解真实用户的提问分布(通常比 Benchmark 模糊得多),以及能从产品中获得灵感推动技术进步。
4. AI 是长跑,不是冲刺
面对”腾讯 AI 慢了吗”这个犀利问题,腾讯姚的回应是:
「AI 是一场长期游戏。我不认为 ChatGPT 和 Claude Code 会是唯一的超级应用,如果真是那样,这个世界会非常灰暗。现在的 AI 行业,就像上世纪 70 年代个人电脑刚刚诞生的阶段。」
他做了两个核心判断:第一,AI 是长期游戏而非短期博弈;第二,未来 AI 行业会走向多元化,而非所有人沿着同一条主线复制。如果这两个判断成立,那”慢了”这个说法就不成立。下半场才刚开始。
5. 性能才是性价比的核心
在讨论 Token 成本时,腾讯姚提出:
「很多人跟我说,最后发现用 Claude Opus 这类高性能模型,反而比用性能较差的模型更省钱——因为它能一次把事情做对。」
性价比不等于便宜。一次做对意味着节省了反复尝试的 Token 和人力成本。在他看来,打造一个在大部分任务上具备强鲁棒性的小模型,比在少数复杂任务上提升一两个点更有实际价值。
交汇:两个 Shunyu Yao 在哪里达成共识
把两段对话放在一起,有几个共识浮现得很清晰:
模型能力趋同,Benchmark 正在失去意义。 DeepMind 姚说 SWE-bench 上的差距已经是噪声不是信号,腾讯姚说国内的刷榜文化是在浪费精力。两人从不同角度得出同一个结论:纸面分数不再是竞争力的核心指标。
Coding / Agent 是当前最关键的场景。 DeepMind 姚认为这是唯一形成了数据飞轮的 AI 原生场景,腾讯姚则说代码 Agent “就像当年的预训练一样,是所有模型厂商都必须攻克的基础能力”。
“下半场”的核心是找对问题,而不是比拼方法。 DeepMind 姚说”现在大家更难的事情,是去想明白要去做什么”,腾讯姚则把这一点提炼成了他的标志性框架。表述方式不同,核心判断一致。
AI 是长期游戏。 DeepMind 姚说”谁的位置都不稳固,没有到什么终局之战”,腾讯姚说”AI 是一场长期游戏”。两人都不认为当前的产品形态是终局。
分岔:两个 Shunyu Yao 在哪里分道扬镳
共识之下,更有意思的是分歧。
壁垒在哪?模型 vs 生态
DeepMind 姚认为壁垒在模型端。他举了 Manus 和 Open Cloud 的例子:这两个最有名的”壳”最终都卖给了模型公司(Meta 和 OpenAI),说明产品壳很难脱离模型的掌心。Cursor 是他认为最有可能”逃逸”的,但即便如此也已经面临 Anthropic 的竞争压力。
腾讯姚则认为壁垒在上下文和生态中。他反复强调「Context(上下文)的重要性会与日俱增」,模型越来越擅长处理复杂输入,企业的竞争壁垒将越来越来源于是否掌握最原始的输入数据和用户行为信息。这正是他选择腾讯的核心逻辑。
这是一个非常根本的分歧。一个赌的是技术纵深,一个赌的是场景宽度。
组织模式:做 Bet 还是做 Co-Design?
DeepMind 姚推崇 Anthropic 式的 Top Down Bet:技术 Leader 看到信号,全公司扑上去。他认为这是 Startup 最需要的能力,也是 Anthropic 区别于 OpenAI 和 Google 的核心竞争力。
腾讯姚则强调信任驱动的 Co-Design,模型团队和产品团队建立信任,换位思考,共同定义标准。他在腾讯的第一个关键决策就是在自家预训练模型还没准备好的时候,先派最强的后训练骨干去帮元宝做好产品体验,以此建立合作信任。
两种路径各有道理:前者适合高度聚焦的 Startup,后者适合有多条产品线的大厂。有趣的是,DeepMind 姚自己也承认 Google 有”另一套打法”,大公司的优势是”方方面面都有储备,任何一个方向成了都能跟上”。
对 ChatBot 的态度:很蠢 vs 还在发展
DeepMind 姚对当前的主流产品形态有一个相当激烈的判断:
「模型明明有那么多的能力,但居然用的是 ChatBot 的方法。不太 Make Sense。」
他认为聊天机器人本质上是搜索的延伸,远远没有释放模型的真正能力。至于什么才是正确的形态,他坦言”没想明白,要想明白我就干了”。
腾讯姚的态度温和得多。他没有否定当前产品形态,而是认为未来会有源源不断的新机会诞生,ChatGPT 和 Claude Code 不会是唯一的超级应用。他的策略是:先在现有形态上做好(元宝、Workbuddy、CodeBuddy),同时保持想象力。
个人选择:探索 vs 扎根
DeepMind 姚的职业轨迹充满”折磨自己”的痕迹。从凝聚态物理换到高能理论(纯粹因为更难),从 Anthropic 换到 Google(为了学不一样的东西),他坦言自己”应该不会在 Google 待太久”。驱动他的是学习和探索,而非组织使命。
腾讯姚则选择扎根。他明确表示自己的目标是「在中国建立一个长期的、基于通用人工智能的组织」,并为此设计了基础层 - 产品层 - 前沿探索层的三角架构。驱动他的是建立一个能持续运转的机构。
两种 AI 世界观
把两个 Shunyu Yao 的判断叠在一起看,浮现出的其实是两种截然不同的 AI 世界观。
**DeepMind 姚的世界观是”冲浪论”**:AI 是一个不可阻挡的浪,人只是冲浪者。技术本质是简单的,不需要天才,需要靠谱的工程师系统性地做实验。个人不重要,组织也只能顺势而为。最有价值的事是找到还没有被别人占领的下一个浪尖。
**腾讯姚的世界观是”长跑论”**:AI 是一场马拉松,才刚跑完前几公里。技术方法已经成熟,真正困难的是找到值得解决的问题并持续迭代。场景和生态是壁垒,耐心和诚实是品质。最有价值的事是建立一个能跑完全程的组织。
两种世界观没有对错之分。一个是物理学家的视角,看到的是浪的必然性和个体的渺小;一个是产品架构师的视角,看到的是机会的广阔和组织的力量。
也许正因为他们站在不同的位置、带着不同的基因看同一场变革,才让这两段对话拼在一起时格外有价值——你很少能看到两个背景如此相似、路径如此不同的人,同时对同一个行业做出如此坦诚的判断。
信息来源:
- 张小珺《语言及世界》播客:对 Google DeepMind 研究员姚顺宇的 4 小时访谈
- 汤道生对话腾讯首席 AI 科学家姚顺雨:腾讯 AI,慢了吗?