听完姚顺宇 4 小时访谈，我记下了 8 个会颠覆你认知的 AI 判断

一个从清华到斯坦福、从理论物理半路出家、在 Anthropic 和 Gemini 都训过模型的人，4 小时把 2026 年 AI 业内最不愿意公开说的话都说了。

最近张小珺访谈了姚顺宇。硅谷有两个姚顺宇，一个一直做 CS，另一个是从理论物理跨界进 AI 的姚顺宇，本期嘉宾是后者。他参与过 Claude 3.7、4.5 和 Gemini 3 的研发，2024 年加入 Anthropic，2025 年跳槽到了 Gemini。

这是少有的一线研究员愿意说真话的访谈。4 小时听下来，我整理出 8 个反复回放的判断。有些和外界共识完全相反。

1. AI 下半场的难点不是”做不出来”，是”不知道做什么”

姚顺宇给现在 AI 行业下了一个定义：

大家已经不那么担心 AI 是不是能做得到，而是担心这件事是不是被良好定义。

一年前模型公司还在比拼 reasoning 谁追得上谁。现在 Gemini、OpenAI、Anthropic 三家在公开 benchmark 上分差几乎都在噪声范围内，sweepbench 都在 80% 附近，高一两个百分点是噪声不是信号。

真正的问题变成了：定义你想要什么。

这是一个商品化的信号。模型变成原材料，竞争点从”能不能做”转移到”下注做什么”。

对应用层开发者来说，这反而是好消息。模型同质化意味着不用再纠结”用 Claude 还是 Gemini”，能做的事都差不多。决定产品胜负的，是你定义问题的能力。

2. 预训练根本没撞墙，撞墙的人 90% 是有 bug

外界说预训练 scaling law 见顶大半年了。姚顺宇的回答很硬：

完全没有。未来四个月也没看到到头的迹象。

他给了一个特别清醒的判断。一个人觉得规律到头，无非三种可能：

规律的适用范围真的到了边界
某个前提条件比如数据撞墙了
工作里有 bug 自己没发现

他的观察是，绝大多数”撞墙”是第三种。要么科学假设没选对（比如 token horizon、数据筛选），要么纯粹代码 bug。

修好一个 bug 带来的进展，远大于一些很神奇的技巧。

这话很有意思。它把”模型不再进步”这种宏大叙事，拉回到一个非常具体的工程问题。所谓 scaling law 的尽头，可能只是某个团队的某段实现没写对。Anthropic 和 Gemini 都还在涨，OpenAI 在预训练上卡了很久，说明这不是物理极限，是组织能力的差距。

3. Coding 爆发的两个原生优势

这一段每个独立开发者都该反复看。

第一，reward signal 极其清晰。

写代码这件事，输入输出可以做单元测试，对就是对，错就是错。模型训练有据可依。绝大多数其他场景都没有这个特性。

第二，GitHub 是上天给 AI 的礼物。

GitHub 汇聚了过去几十年程序员沉淀的高质量代码。你去网上随便爬数据，会发现 GitHub 的质量显著高于普通网页。

还有一个我没想到的点：好代码的标准是收敛的。优秀程序员的风格类似：简洁、结构清楚、合理抽象。不像写小说写产品需求，每个人审美天差地别。这让 AI 训练任务变成了良好定义的问题。

姚顺宇自己工作中，保守估计 90% 的代码由模型产生，激进估计 99% 到 100%。研究员的角色已经从”写代码”变成”设计逻辑、给上下文、判断输出”。

这对我们的启示：在 reward signal 清晰 + 数据丰富 + 标准收敛的场景里，AI 会持续碾压人类。如果你的工作不满足这三条，恭喜，短期还安全。

4. 壳产品的两条活路

OpenCloud 卖给了 OpenAI，Manus 卖给了 Meta。姚顺宇说：

一个东西要长久生存，需要考虑壁垒。目前壁垒都在模型测。

壳产品想活下来，只有两条路：

路径一：增长速度足够快。 在模型公司反应过来之前占领用户心智，然后演化出自己的模型。Cursor 在走这条路。但即便是 Cursor，现在也极有危机感，因为它和 Anthropic 从合作伙伴变成了正面竞争对手。

路径二：市场小到模型公司懒得管。 Manus 是这个例子，市场太小，Gemini 即便能做也不会花时间。

founder 要决定：抱着万分之一的几率赌一票大的，还是抱着百分之一的几率先吃一个小的。

姚顺宇说如果是他，会先吃一个小的，但有想象空间的小的。

对独立开发者的启示：2026 年最稳的路径不是去做下一个 ChatGPT，是去做一个 Gemini 看不上、但用户愿意付钱的细分场景。

5. 2026 必发生：有限上下文训练，无限上下文使用

这是整场访谈他最确信的技术预测：

“train with finite context, use as infinite context”，用有限的 context length 训练，但使用时用接近无限的 context length。今年是有机会实现的。

为什么重要？因为它直接解锁真正的个人助手。

人本质上就这样工作：记不住所有细节，但能根据当前场景选择性遗忘和检索。如果模型学会”该忘的忘、该记的记”，它就能持续和你交互、获取你的信息、根据场景调用不同部分的记忆。

这不是 RAG，是模型本身具备这种能力。现在已经有几条技术路线在跑，竞争焦点在于哪条效率最高。

这意味着 2026 年下半年，市面上会出现一批真正能”理解你”的 AI 产品。不是上传 PDF 然后检索，是真的能记住你这个人。

6. AI 这行最重要的不是脑子，是”靠谱”

整场访谈最反共识的一段：

AI 这事本来也不太需要脑子。这个行业最重要的特质就是靠谱，做事细，对自己做的事负责任。

清华本科斯坦福博士理论物理出身的人说 AI 不太需要脑子，这话从他嘴里说出来分量很重。

为什么？因为 AI 是一个巨大的系统工程，不是一个人灵光一闪能解决的问题。在这种系统里：

很多评价框架是容易被”黑”掉的（让指标好看但实际没用）
数据分布、训练成本、边界条件都需要全局考虑
一个 bug 没排查就会让你以为撞墙了

一个好的研究员，做的不是”想出绝妙算法”，而是：

把简单的事做得比谁都干净。

这句话我反复回味。它不止适用于 AI 研究，对任何工程领域、对独立开发者都成立。市场不缺聪明人，缺的是把一件事做扎实、对系统负责的人。

7. 24 小时面试题：考察”靠谱”的精妙设计

姚顺宇分享了他的面试题，整场最实用：

让候选人在 24 小时之内，完成一个强化学习项目从 0 到 1。自己选模型、数据、算法。24 小时之后跟我有一个小时讨论。

这道题有三层巧思：

第一层：考察用 AI 协作的能力。 在 AI 时代再考代码写得好不好没意义，重要的是能不能有效利用 AI。

第二层：那一小时讨论是挂人的地方。 如果你全权扔给 AI，不去理解 AI 做了什么，讨论时立刻露馅。这考的是”你和 AI 是协作还是甩锅”。

第三层（最阴险）：为什么是 24 小时？

看这个人有多看重这个机会。如果他能熬夜撑住 24 小时，说明他重视。撑不住，说明他对这个机会也没那么看重。

我看到这里直接拍腿。这道题在测能力、投入度、责任心、和 AI 协作的态度，全部一次性考完。

8. 个人英雄主义已经过去

姚顺宇反复强调：

个人英雄主义时代对于 Language Model 来说可能过去了。在技术 scale up 之前，找到那个技术的人可能是英雄。找到之后，更多的是集体主义。

这和现在外界疯狂神化 AI 研究员、几千万年薪挖人形成强烈反差。姚顺宇自己受益于这个市场，但他说：

我并不知道这事是不是一件好事。可能对人的炒作有点过分了。

他甚至说：

我来这个行业的时候，个人英雄主义的时代已经过去了，所以也没有什么英雄。有时候你甚至觉得旧时代英雄有点蠢。

这种”没有包袱”的直接性，恰恰是他作为非 AI 科班出身的优势：没有导师没有旧友，可以直接说”傻就是傻”。

写在最后：3 个引申思考

听完 4 小时，我提炼出 3 个对独立开发者最实用的引申：

1. 不要押注通用场景，押注模型公司看不上但有想象空间的小场景。 模型同质化的下半场，应用层的护城河不在技术，在场景理解和用户洞察。

2. 写代码的能力还重要吗？ 重要，但权重在变。未来好的程序员有三个特质：技术强、能理解工作如何适配大组织、规划能力强。中等水平的程序员价值会被压扁，顶级和糟糕的差距会拉大。

3. “靠谱”被严重低估。 AI 时代纯智力门槛在降低，但”系统性思考、做事细致、对全局负责”反而稀缺。这是普通人能拿到的最有杠杆的特质。

姚顺宇有一句话送给每个还在犹豫的人：

做现在最热火的事并不是一个正确的选择，做现在没有人做到的事可能更多的是一个好的选择。

末班车这个比喻挺扎心。纯做语言模型已经不是蓝海。但 AI 是一个很大的方向，多模态、机器人、用 AI 解决基础科学问题，都还是 Blue Sky。

如果你足够年轻、足够好奇、还愿意折磨自己，2026 年依然是上车的好时机。只是这次，别再追昨天的浪，去找明天的海。