一句话定位
朱松纯,北京大学讲席教授、北京通用人工智能研究院院长。留美28年、发表400余篇顶会论文、拿过马尔奖和赫尔姆霍茨奖的计算机视觉大佬,在2020年回国后all in通用人工智能,走了一条和OpenAI完全不同的路。
他的核心主张:大模型是鹦鹉,AGI需要乌鸦。
两个范式的对立
朱松纯用一个极其精炼的类比概括了当前AI发展的根本分歧:
| 鹦鹉范式(当前主流) | 乌鸦范式(朱松纯主张) | |
|---|---|---|
| 数据需求 | 大数据 | 小数据 |
| 任务范围 | 小任务(单一、预定义) | 大任务(无限、自主生成) |
| 驱动力 | 统计相关性 | 价值与因果 |
| 智能层级 | 模仿(学舌) | 推理(自主解题) |
| 代表 | GPT、Gemini、Claude | 通研院"通通" |
鹦鹉学舌——无论模仿得多像,它并不理解自己在说什么。数据越多,模仿越像,但本质没变。
乌鸦喝水——从没有人教乌鸦往瓶子里扔石子,它通过因果推理自主解决了一个全新问题。这才是智能。
"大模型的成就堪比登上了珠峰,但通用人工智能是探月工程。" —— 朱松纯
这句话的深意是:珠峰再高也在地球上,登月需要完全不同的工程体系。你不能通过把珠峰垒更高来到达月球。
AGI的三个硬标准
朱松纯在2023年AAAI与Stuart Russell的对话中明确提出,通用人工智能必须满足三个条件:
1. 处理无限任务
不是"能做很多任务",而是能处理未预定义的任务——包括那些在复杂动态的物理和社会环境中从未被人指定过的任务。
当前大模型:能做大量已有任务 ✓,但面对genuinely novel的物理推理仍然脆弱 ✗
2. 自主性
智能体应该自己产生任务,而不是等人类给prompt。就像人类儿童不需要别人告诉他"去探索世界"——好奇心和价值驱动他自主行动。
当前大模型:完全被动,没有prompt就是一块石头 ✗
3. 价值系统
目标由内在价值定义。不是"优化某个loss function",而是有一套可解释的、层次化的价值体系来指导所有行为。
当前大模型:RLHF是外挂的偏好拟合,不是结构化价值架构 ✗
用这三条标准去卡,当前所有大模型——无论参数多大——都不是AGI,甚至不在通向AGI的路上。
AI的"暗物质"
朱松纯提出了一个极具洞察力的概念:AI的暗物质。
宇宙中可见物质只占5%,暗物质占27%。同样,当前AI关注的语言、图像识别等能力只是智能的"可见部分",真正支撑智能的是那些看不见的东西:
- 物理常识:杯子倒了水会洒、重的东西会往下掉、推门需要用手
- 社会常识:别人皱眉可能是不高兴、打断别人说话不礼貌、排队要按顺序
- 因果链:不是"A和B经常一起出现",而是"A导致了B"
这些常识人类三岁就具备,但当前AI——无论参数多大——都没有以结构化的方式掌握。大模型能输出看起来"有常识"的回答,但那是统计拟合的结果,不是因果理解。
证据:让GPT-4预测一个从未见过的物理场景(比如一个特殊形状的容器装水后倒扣),它经常给出违反物理直觉的答案。
为机器立"心"
朱松纯的技术路线可以总结为八个字:为机器立心,价值驱动。
他认为实现AGI需要解决八个关键技术问题:
- 认知架构 — 不是端到端黑盒,而是可解释的结构化系统
- 价值函数 — 驱动一切行为的根本动力
- 自我意识 — 知道"我是谁"、"我在做什么"
- 社交智能 — 理解他人意图、预测他人行为
- 价值驱动 — 由内在价值产生任务,不是被动响应
- 具身智能 — 必须有身体,在物理世界中交互
- 可解释性 — 决策过程透明,人类能理解
- 人机互信 — 人类能信任AI,AI能理解人类
这不是一个"改进大模型"的路线,而是一个完全不同的工程体系。
"通通":他的答卷
朱松纯不只是批评,他拿出了实践成果——通用智能人"通通"(Little Girl)。
"通通"的特别之处:
价值驱动行为生成:你可以调节"通通"的价值偏好(好奇、整齐、干净),她会根据价值自主产生行为。墙上相框歪了→她"爱整齐"→自己决定去摆正→发现够不着→自己找凳子→踩上去完成。
全程无人指令。这不是"执行命令",而是"自主决定做什么、怎么做"。
可解释:你能清楚看到她为什么做这件事(因为爱整齐)、为什么选这个方案(因为够不着所以找凳子)。决策链路是透明的。
当然,"通通"目前还在实验室环境中,场景复杂度远不及真实世界。但它证明了一件事:不靠大数据、不靠scaling,靠认知架构和价值驱动,也能产生看起来"智能"的自主行为。
四层价值对齐
在AI安全领域,朱松纯的价值对齐方案比主流的RLHF更加结构化:
| 层级 | 内容 | 对比主流方案 |
|---|---|---|
| 共享表征 | AI与人对世界有共同理解 | 主流:embedding空间对齐 |
| 共享核心知识 | 物理因果、逻辑规则 | 主流:靠大量数据隐式学习 |
| 共享社会规范 | 遵循人类社会规则 | 主流:safety training |
| 共享价值观 | 与人类道德一致 | 主流:RLHF偏好拟合 |
关键区别:朱松纯的方案是结构化的、可解释的,你能看到AI的价值观是什么、为什么做出某个决策。而主流方案是黑盒的——RLHF之后模型"看起来"对齐了,但没人知道内部发生了什么。
他创办的公司:暗物智能
学术之外,朱松纯也在做商业化验证。暗物智能(DMAI)成立于2018年,已完成B轮融资。
技术路线:基于"小数据、大任务"认知AI技术范式。
落地场景:
- 自适应教育(根据学生的认知状态动态调整教学策略)
- 金融科技(需要因果推理和风险判断的场景)
- 泛娱乐(需要理解用户意图和情感的交互)
这些场景有一个共同特点:需要深层人机互动、个性化理解、因果推理——恰好是大模型做不好、但认知架构擅长的领域。
人才培养:本博贯通
朱松纯不只做研究,还在重构AI教育:
- 北京大学元培学院:通用人工智能实验班
- 清华大学自动化系:因材施教培养计划(通用人工智能方向)
- 课程定位:"新工科 + 新文科"交叉的通识专业
他亲自逐条审核物理课大纲,确保学生学的不是陈旧知识而是前沿进展。这种对教育的投入说明他在下一盘长棋——如果AGI的路注定漫长,那培养一代人比发一篇论文更重要。
"可能我们这一代人也只是做一个转移和铺垫,但我相信我们终将能够取得像杨振宁先生那样大师级的、领先世界的成就。"
如何评估他的观点
朱松纯的论证体系有三个层次,强度递减:
最强的部分:问题诊断
大模型缺乏因果推理、缺乏内在价值、缺乏自主目标生成、缺乏物理常识——这些不是观点,是可验证的事实。在这一点上,即使是OpenAI的研究员也不会反驳。
中等强度:替代路线的理论自洽性
"认知架构 + 价值驱动 + 因果推理"作为AGI路线,理论上是自洽的。但从理论自洽到工程实现,还有巨大的距离。"通通"在实验室能摆正相框,和在真实世界中表现出通用智能,差了几个数量级的复杂度。
最弱的部分:排他性判断
"大模型不是正确路径"这个结论可能过强。当前的趋势是大模型正在通过tool use、planning、memory、embodiment等外部架构逐步补上他指出的缺陷。最终的AGI系统可能是:大模型提供语言和世界知识的底座 + 类似朱松纯主张的认知架构提供价值驱动和因果推理。
也就是说,他可能不是错的,而是不完整的——大模型和认知架构可能不是互斥的,而是互补的。
时间会给出答案
验证朱松纯观点的终极裁判是时间:
- 如果 scaling + Agent + 具身 = AGI → 他的路径判断错了
- 如果 scaling 撞墙 + 需要认知架构重构 → 他对了
- 如果最终路径是大模型底座 + 认知架构上层 → 双方各对一半
无论最终结果如何,他在所有人冲scaling的时代指出了被忽略的结构性缺失。这种在潮流面前的清醒,本身就是值得记录的。
"如果只跟在Deepmind、OpenAI后面跑,永远不可能做出领先世界的成就。"
延伸阅读
- Stuart Russell 与朱松纯 AAAI SafeAI 对话(2023.02)
- 北京通用人工智能研究院成果展实录(2024.01)
- 《Dark Matter of Intelligence》系列论文
- 暗物智能官网:https://www.dm-ai.cn/
- TongTest 通用人工智能评级白皮书