朱松纯：大模型登了珠峰，但AGI是登月

一句话定位

朱松纯，北京大学讲席教授、北京通用人工智能研究院院长。留美28年、发表400余篇顶会论文、拿过马尔奖和赫尔姆霍茨奖的计算机视觉大佬，在2020年回国后all in通用人工智能，走了一条和OpenAI完全不同的路。

他的核心主张：大模型是鹦鹉，AGI需要乌鸦。

两个范式的对立

朱松纯用一个极其精炼的类比概括了当前AI发展的根本分歧：

	鹦鹉范式（当前主流）	乌鸦范式（朱松纯主张）
数据需求	大数据	小数据
任务范围	小任务（单一、预定义）	大任务（无限、自主生成）
驱动力	统计相关性	价值与因果
智能层级	模仿（学舌）	推理（自主解题）
代表	GPT、Gemini、Claude	通研院"通通"

鹦鹉学舌——无论模仿得多像，它并不理解自己在说什么。数据越多，模仿越像，但本质没变。

乌鸦喝水——从没有人教乌鸦往瓶子里扔石子，它通过因果推理自主解决了一个全新问题。这才是智能。

"大模型的成就堪比登上了珠峰，但通用人工智能是探月工程。" —— 朱松纯

这句话的深意是：珠峰再高也在地球上，登月需要完全不同的工程体系。你不能通过把珠峰垒更高来到达月球。

AGI的三个硬标准

朱松纯在2023年AAAI与Stuart Russell的对话中明确提出，通用人工智能必须满足三个条件：

1. 处理无限任务

不是"能做很多任务"，而是能处理未预定义的任务——包括那些在复杂动态的物理和社会环境中从未被人指定过的任务。

当前大模型：能做大量已有任务 ✓，但面对genuinely novel的物理推理仍然脆弱 ✗

2. 自主性

智能体应该自己产生任务，而不是等人类给prompt。就像人类儿童不需要别人告诉他"去探索世界"——好奇心和价值驱动他自主行动。

当前大模型：完全被动，没有prompt就是一块石头 ✗

3. 价值系统

目标由内在价值定义。不是"优化某个loss function"，而是有一套可解释的、层次化的价值体系来指导所有行为。

当前大模型：RLHF是外挂的偏好拟合，不是结构化价值架构 ✗

用这三条标准去卡，当前所有大模型——无论参数多大——都不是AGI，甚至不在通向AGI的路上。

AI的"暗物质"

朱松纯提出了一个极具洞察力的概念：AI的暗物质。

宇宙中可见物质只占5%，暗物质占27%。同样，当前AI关注的语言、图像识别等能力只是智能的"可见部分"，真正支撑智能的是那些看不见的东西：

物理常识：杯子倒了水会洒、重的东西会往下掉、推门需要用手
社会常识：别人皱眉可能是不高兴、打断别人说话不礼貌、排队要按顺序
因果链：不是"A和B经常一起出现"，而是"A导致了B"

这些常识人类三岁就具备，但当前AI——无论参数多大——都没有以结构化的方式掌握。大模型能输出看起来"有常识"的回答，但那是统计拟合的结果，不是因果理解。

证据：让GPT-4预测一个从未见过的物理场景（比如一个特殊形状的容器装水后倒扣），它经常给出违反物理直觉的答案。

为机器立"心"

朱松纯的技术路线可以总结为八个字：为机器立心，价值驱动。

他认为实现AGI需要解决八个关键技术问题：

认知架构 — 不是端到端黑盒，而是可解释的结构化系统
价值函数 — 驱动一切行为的根本动力
自我意识 — 知道"我是谁"、"我在做什么"
社交智能 — 理解他人意图、预测他人行为
价值驱动 — 由内在价值产生任务，不是被动响应
具身智能 — 必须有身体，在物理世界中交互
可解释性 — 决策过程透明，人类能理解
人机互信 — 人类能信任AI，AI能理解人类

这不是一个"改进大模型"的路线，而是一个完全不同的工程体系。

"通通"：他的答卷

朱松纯不只是批评，他拿出了实践成果——通用智能人"通通"（Little Girl）。

"通通"的特别之处：

价值驱动行为生成：你可以调节"通通"的价值偏好（好奇、整齐、干净），她会根据价值自主产生行为。墙上相框歪了→她"爱整齐"→自己决定去摆正→发现够不着→自己找凳子→踩上去完成。

全程无人指令。这不是"执行命令"，而是"自主决定做什么、怎么做"。

可解释：你能清楚看到她为什么做这件事（因为爱整齐）、为什么选这个方案（因为够不着所以找凳子）。决策链路是透明的。

当然，"通通"目前还在实验室环境中，场景复杂度远不及真实世界。但它证明了一件事：不靠大数据、不靠scaling，靠认知架构和价值驱动，也能产生看起来"智能"的自主行为。

四层价值对齐

在AI安全领域，朱松纯的价值对齐方案比主流的RLHF更加结构化：

层级	内容	对比主流方案
共享表征	AI与人对世界有共同理解	主流：embedding空间对齐
共享核心知识	物理因果、逻辑规则	主流：靠大量数据隐式学习
共享社会规范	遵循人类社会规则	主流：safety training
共享价值观	与人类道德一致	主流：RLHF偏好拟合

关键区别：朱松纯的方案是结构化的、可解释的，你能看到AI的价值观是什么、为什么做出某个决策。而主流方案是黑盒的——RLHF之后模型"看起来"对齐了，但没人知道内部发生了什么。

他创办的公司：暗物智能

学术之外，朱松纯也在做商业化验证。暗物智能（DMAI）成立于2018年，已完成B轮融资。

技术路线：基于"小数据、大任务"认知AI技术范式。

落地场景：

自适应教育（根据学生的认知状态动态调整教学策略）
金融科技（需要因果推理和风险判断的场景）
泛娱乐（需要理解用户意图和情感的交互）

这些场景有一个共同特点：需要深层人机互动、个性化理解、因果推理——恰好是大模型做不好、但认知架构擅长的领域。

人才培养：本博贯通

朱松纯不只做研究，还在重构AI教育：

北京大学元培学院：通用人工智能实验班
清华大学自动化系：因材施教培养计划（通用人工智能方向）
课程定位："新工科 + 新文科"交叉的通识专业

他亲自逐条审核物理课大纲，确保学生学的不是陈旧知识而是前沿进展。这种对教育的投入说明他在下一盘长棋——如果AGI的路注定漫长，那培养一代人比发一篇论文更重要。

"可能我们这一代人也只是做一个转移和铺垫，但我相信我们终将能够取得像杨振宁先生那样大师级的、领先世界的成就。"

如何评估他的观点

朱松纯的论证体系有三个层次，强度递减：

最强的部分：问题诊断

大模型缺乏因果推理、缺乏内在价值、缺乏自主目标生成、缺乏物理常识——这些不是观点，是可验证的事实。在这一点上，即使是OpenAI的研究员也不会反驳。

中等强度：替代路线的理论自洽性

"认知架构 + 价值驱动 + 因果推理"作为AGI路线，理论上是自洽的。但从理论自洽到工程实现，还有巨大的距离。"通通"在实验室能摆正相框，和在真实世界中表现出通用智能，差了几个数量级的复杂度。

最弱的部分：排他性判断

"大模型不是正确路径"这个结论可能过强。当前的趋势是大模型正在通过tool use、planning、memory、embodiment等外部架构逐步补上他指出的缺陷。最终的AGI系统可能是：大模型提供语言和世界知识的底座 + 类似朱松纯主张的认知架构提供价值驱动和因果推理。

也就是说，他可能不是错的，而是不完整的——大模型和认知架构可能不是互斥的，而是互补的。

时间会给出答案

验证朱松纯观点的终极裁判是时间：

如果 scaling + Agent + 具身 = AGI → 他的路径判断错了
如果 scaling 撞墙 + 需要认知架构重构 → 他对了
如果最终路径是大模型底座 + 认知架构上层 → 双方各对一半

无论最终结果如何，他在所有人冲scaling的时代指出了被忽略的结构性缺失。这种在潮流面前的清醒，本身就是值得记录的。

"如果只跟在Deepmind、OpenAI后面跑，永远不可能做出领先世界的成就。"