返回博客Back to Blog

~/yanhua $ cat posts/yao-shunyu-8-judgments.md

听完姚顺宇 4 小时访谈,我记下了 8 个会颠覆你认知的 AI 判断

在 Anthropic 和 Gemini 都训过模型的研究员姚顺宇,4 小时把 2026 年 AI 业内最不愿意公开说的话都说了。预训练没撞墙、个人英雄主义结束、壳产品两条活路、以及一道 24 小时面试题——8 个反复回放的判断。

一个从清华到斯坦福、从理论物理半路出家、在 Anthropic 和 Gemini 都训过模型的人,4 小时把 2026 年 AI 业内最不愿意公开说的话都说了。

最近张小珺访谈了姚顺宇。硅谷有两个姚顺宇,一个一直做 CS,另一个是从理论物理跨界进 AI 的姚顺宇,本期嘉宾是后者。他参与过 Claude 3.7、4.5 和 Gemini 3 的研发,2024 年加入 Anthropic,2025 年跳槽到了 Gemini。

这是少有的一线研究员愿意说真话的访谈。4 小时听下来,我整理出 8 个反复回放的判断。有些和外界共识完全相反。

1. AI 下半场的难点不是”做不出来”,是”不知道做什么”

姚顺宇给现在 AI 行业下了一个定义:

大家已经不那么担心 AI 是不是能做得到,而是担心这件事是不是被良好定义。

一年前模型公司还在比拼 reasoning 谁追得上谁。现在 Gemini、OpenAI、Anthropic 三家在公开 benchmark 上分差几乎都在噪声范围内,sweepbench 都在 80% 附近,高一两个百分点是噪声不是信号。

真正的问题变成了:定义你想要什么。

这是一个商品化的信号。模型变成原材料,竞争点从”能不能做”转移到”下注做什么”。

对应用层开发者来说,这反而是好消息。模型同质化意味着不用再纠结”用 Claude 还是 Gemini”,能做的事都差不多。决定产品胜负的,是你定义问题的能力。

2. 预训练根本没撞墙,撞墙的人 90% 是有 bug

外界说预训练 scaling law 见顶大半年了。姚顺宇的回答很硬:

完全没有。未来四个月也没看到到头的迹象。

他给了一个特别清醒的判断。一个人觉得规律到头,无非三种可能:

  1. 规律的适用范围真的到了边界
  2. 某个前提条件比如数据撞墙了
  3. 工作里有 bug 自己没发现

他的观察是,绝大多数”撞墙”是第三种。要么科学假设没选对(比如 token horizon、数据筛选),要么纯粹代码 bug。

修好一个 bug 带来的进展,远大于一些很神奇的技巧。

这话很有意思。它把”模型不再进步”这种宏大叙事,拉回到一个非常具体的工程问题。所谓 scaling law 的尽头,可能只是某个团队的某段实现没写对。Anthropic 和 Gemini 都还在涨,OpenAI 在预训练上卡了很久,说明这不是物理极限,是组织能力的差距。

3. Coding 爆发的两个原生优势

这一段每个独立开发者都该反复看。

第一,reward signal 极其清晰。

写代码这件事,输入输出可以做单元测试,对就是对,错就是错。模型训练有据可依。绝大多数其他场景都没有这个特性。

第二,GitHub 是上天给 AI 的礼物。

GitHub 汇聚了过去几十年程序员沉淀的高质量代码。你去网上随便爬数据,会发现 GitHub 的质量显著高于普通网页。

还有一个我没想到的点:好代码的标准是收敛的。优秀程序员的风格类似:简洁、结构清楚、合理抽象。不像写小说写产品需求,每个人审美天差地别。这让 AI 训练任务变成了良好定义的问题。

姚顺宇自己工作中,保守估计 90% 的代码由模型产生,激进估计 99% 到 100%。研究员的角色已经从”写代码”变成”设计逻辑、给上下文、判断输出”。

这对我们的启示:在 reward signal 清晰 + 数据丰富 + 标准收敛的场景里,AI 会持续碾压人类。如果你的工作不满足这三条,恭喜,短期还安全。

4. 壳产品的两条活路

OpenCloud 卖给了 OpenAI,Manus 卖给了 Meta。姚顺宇说:

一个东西要长久生存,需要考虑壁垒。目前壁垒都在模型测。

壳产品想活下来,只有两条路:

路径一:增长速度足够快。 在模型公司反应过来之前占领用户心智,然后演化出自己的模型。Cursor 在走这条路。但即便是 Cursor,现在也极有危机感,因为它和 Anthropic 从合作伙伴变成了正面竞争对手。

路径二:市场小到模型公司懒得管。 Manus 是这个例子,市场太小,Gemini 即便能做也不会花时间。

founder 要决定:抱着万分之一的几率赌一票大的,还是抱着百分之一的几率先吃一个小的。

姚顺宇说如果是他,会先吃一个小的,但有想象空间的小的

对独立开发者的启示:2026 年最稳的路径不是去做下一个 ChatGPT,是去做一个 Gemini 看不上、但用户愿意付钱的细分场景。

5. 2026 必发生:有限上下文训练,无限上下文使用

这是整场访谈他最确信的技术预测:

“train with finite context, use as infinite context”,用有限的 context length 训练,但使用时用接近无限的 context length。今年是有机会实现的。

为什么重要?因为它直接解锁真正的个人助手

人本质上就这样工作:记不住所有细节,但能根据当前场景选择性遗忘和检索。如果模型学会”该忘的忘、该记的记”,它就能持续和你交互、获取你的信息、根据场景调用不同部分的记忆。

这不是 RAG,是模型本身具备这种能力。现在已经有几条技术路线在跑,竞争焦点在于哪条效率最高。

这意味着 2026 年下半年,市面上会出现一批真正能”理解你”的 AI 产品。不是上传 PDF 然后检索,是真的能记住你这个人。

6. AI 这行最重要的不是脑子,是”靠谱”

整场访谈最反共识的一段:

AI 这事本来也不太需要脑子。这个行业最重要的特质就是靠谱,做事细,对自己做的事负责任。

清华本科斯坦福博士理论物理出身的人说 AI 不太需要脑子,这话从他嘴里说出来分量很重。

为什么?因为 AI 是一个巨大的系统工程,不是一个人灵光一闪能解决的问题。在这种系统里:

  • 很多评价框架是容易被”黑”掉的(让指标好看但实际没用)
  • 数据分布、训练成本、边界条件都需要全局考虑
  • 一个 bug 没排查就会让你以为撞墙了

一个好的研究员,做的不是”想出绝妙算法”,而是:

把简单的事做得比谁都干净。

这句话我反复回味。它不止适用于 AI 研究,对任何工程领域、对独立开发者都成立。市场不缺聪明人,缺的是把一件事做扎实、对系统负责的人。

7. 24 小时面试题:考察”靠谱”的精妙设计

姚顺宇分享了他的面试题,整场最实用:

让候选人在 24 小时之内,完成一个强化学习项目从 0 到 1。自己选模型、数据、算法。24 小时之后跟我有一个小时讨论。

这道题有三层巧思:

第一层:考察用 AI 协作的能力。 在 AI 时代再考代码写得好不好没意义,重要的是能不能有效利用 AI。

第二层:那一小时讨论是挂人的地方。 如果你全权扔给 AI,不去理解 AI 做了什么,讨论时立刻露馅。这考的是”你和 AI 是协作还是甩锅”。

第三层(最阴险):为什么是 24 小时?

看这个人有多看重这个机会。如果他能熬夜撑住 24 小时,说明他重视。撑不住,说明他对这个机会也没那么看重。

我看到这里直接拍腿。这道题在测能力、投入度、责任心、和 AI 协作的态度,全部一次性考完。

8. 个人英雄主义已经过去

姚顺宇反复强调:

个人英雄主义时代对于 Language Model 来说可能过去了。在技术 scale up 之前,找到那个技术的人可能是英雄。找到之后,更多的是集体主义。

这和现在外界疯狂神化 AI 研究员、几千万年薪挖人形成强烈反差。姚顺宇自己受益于这个市场,但他说:

我并不知道这事是不是一件好事。可能对人的炒作有点过分了。

他甚至说:

我来这个行业的时候,个人英雄主义的时代已经过去了,所以也没有什么英雄。有时候你甚至觉得旧时代英雄有点蠢。

这种”没有包袱”的直接性,恰恰是他作为非 AI 科班出身的优势:没有导师没有旧友,可以直接说”傻就是傻”。

写在最后:3 个引申思考

听完 4 小时,我提炼出 3 个对独立开发者最实用的引申:

1. 不要押注通用场景,押注模型公司看不上但有想象空间的小场景。 模型同质化的下半场,应用层的护城河不在技术,在场景理解和用户洞察。

2. 写代码的能力还重要吗? 重要,但权重在变。未来好的程序员有三个特质:技术强、能理解工作如何适配大组织、规划能力强。中等水平的程序员价值会被压扁,顶级和糟糕的差距会拉大。

3. “靠谱”被严重低估。 AI 时代纯智力门槛在降低,但”系统性思考、做事细致、对全局负责”反而稀缺。这是普通人能拿到的最有杠杆的特质。


姚顺宇有一句话送给每个还在犹豫的人:

做现在最热火的事并不是一个正确的选择,做现在没有人做到的事可能更多的是一个好的选择。

末班车这个比喻挺扎心。纯做语言模型已经不是蓝海。但 AI 是一个很大的方向,多模态、机器人、用 AI 解决基础科学问题,都还是 Blue Sky。

如果你足够年轻、足够好奇、还愿意折磨自己,2026 年依然是上车的好时机。只是这次,别再追昨天的浪,去找明天的海。

喜欢这篇文章?Enjoyed this?

在 X 或 GitHub 上找到我,一起聊聊。Find me on X or GitHub — let's talk.