光合及目
1lux.xyz
← 返回列表
AGI认知架构通用人工智能学术观点人物深度

朱松纯:大模型登了珠峰,但AGI是登月

Sat May 16

朱松纯是全球少数坚持认知架构路线的顶级AI学者。他认为大模型的scaling路线无法通向通用人工智能,提出"小数据大任务"范式,主张为机器立"心"——用价值与因果驱动智能,而非数据堆砌。本文完整梳理其核心主张、论证逻辑与实践成果。

一句话定位

朱松纯,北京大学讲席教授、北京通用人工智能研究院院长。留美28年、发表400余篇顶会论文、拿过马尔奖和赫尔姆霍茨奖的计算机视觉大佬,在2020年回国后all in通用人工智能,走了一条和OpenAI完全不同的路。

他的核心主张:大模型是鹦鹉,AGI需要乌鸦。


两个范式的对立

朱松纯用一个极其精炼的类比概括了当前AI发展的根本分歧:

鹦鹉范式(当前主流) 乌鸦范式(朱松纯主张)
数据需求 大数据 小数据
任务范围 小任务(单一、预定义) 大任务(无限、自主生成)
驱动力 统计相关性 价值与因果
智能层级 模仿(学舌) 推理(自主解题)
代表 GPT、Gemini、Claude 通研院"通通"

鹦鹉学舌——无论模仿得多像,它并不理解自己在说什么。数据越多,模仿越像,但本质没变。

乌鸦喝水——从没有人教乌鸦往瓶子里扔石子,它通过因果推理自主解决了一个全新问题。这才是智能。

"大模型的成就堪比登上了珠峰,但通用人工智能是探月工程。" —— 朱松纯

这句话的深意是:珠峰再高也在地球上,登月需要完全不同的工程体系。你不能通过把珠峰垒更高来到达月球。


AGI的三个硬标准

朱松纯在2023年AAAI与Stuart Russell的对话中明确提出,通用人工智能必须满足三个条件:

1. 处理无限任务

不是"能做很多任务",而是能处理未预定义的任务——包括那些在复杂动态的物理和社会环境中从未被人指定过的任务。

当前大模型:能做大量已有任务 ✓,但面对genuinely novel的物理推理仍然脆弱 ✗

2. 自主性

智能体应该自己产生任务,而不是等人类给prompt。就像人类儿童不需要别人告诉他"去探索世界"——好奇心和价值驱动他自主行动。

当前大模型:完全被动,没有prompt就是一块石头 ✗

3. 价值系统

目标由内在价值定义。不是"优化某个loss function",而是有一套可解释的、层次化的价值体系来指导所有行为。

当前大模型:RLHF是外挂的偏好拟合,不是结构化价值架构 ✗

用这三条标准去卡,当前所有大模型——无论参数多大——都不是AGI,甚至不在通向AGI的路上。


AI的"暗物质"

朱松纯提出了一个极具洞察力的概念:AI的暗物质

宇宙中可见物质只占5%,暗物质占27%。同样,当前AI关注的语言、图像识别等能力只是智能的"可见部分",真正支撑智能的是那些看不见的东西:

  • 物理常识:杯子倒了水会洒、重的东西会往下掉、推门需要用手
  • 社会常识:别人皱眉可能是不高兴、打断别人说话不礼貌、排队要按顺序
  • 因果链:不是"A和B经常一起出现",而是"A导致了B"

这些常识人类三岁就具备,但当前AI——无论参数多大——都没有以结构化的方式掌握。大模型能输出看起来"有常识"的回答,但那是统计拟合的结果,不是因果理解。

证据:让GPT-4预测一个从未见过的物理场景(比如一个特殊形状的容器装水后倒扣),它经常给出违反物理直觉的答案。


为机器立"心"

朱松纯的技术路线可以总结为八个字:为机器立心,价值驱动

他认为实现AGI需要解决八个关键技术问题:

  1. 认知架构 — 不是端到端黑盒,而是可解释的结构化系统
  2. 价值函数 — 驱动一切行为的根本动力
  3. 自我意识 — 知道"我是谁"、"我在做什么"
  4. 社交智能 — 理解他人意图、预测他人行为
  5. 价值驱动 — 由内在价值产生任务,不是被动响应
  6. 具身智能 — 必须有身体,在物理世界中交互
  7. 可解释性 — 决策过程透明,人类能理解
  8. 人机互信 — 人类能信任AI,AI能理解人类

这不是一个"改进大模型"的路线,而是一个完全不同的工程体系。


"通通":他的答卷

朱松纯不只是批评,他拿出了实践成果——通用智能人"通通"(Little Girl)。

"通通"的特别之处:

价值驱动行为生成:你可以调节"通通"的价值偏好(好奇、整齐、干净),她会根据价值自主产生行为。墙上相框歪了→她"爱整齐"→自己决定去摆正→发现够不着→自己找凳子→踩上去完成。

全程无人指令。这不是"执行命令",而是"自主决定做什么、怎么做"。

可解释:你能清楚看到她为什么做这件事(因为爱整齐)、为什么选这个方案(因为够不着所以找凳子)。决策链路是透明的。

当然,"通通"目前还在实验室环境中,场景复杂度远不及真实世界。但它证明了一件事:不靠大数据、不靠scaling,靠认知架构和价值驱动,也能产生看起来"智能"的自主行为。


四层价值对齐

在AI安全领域,朱松纯的价值对齐方案比主流的RLHF更加结构化:

层级 内容 对比主流方案
共享表征 AI与人对世界有共同理解 主流:embedding空间对齐
共享核心知识 物理因果、逻辑规则 主流:靠大量数据隐式学习
共享社会规范 遵循人类社会规则 主流:safety training
共享价值观 与人类道德一致 主流:RLHF偏好拟合

关键区别:朱松纯的方案是结构化的、可解释的,你能看到AI的价值观是什么、为什么做出某个决策。而主流方案是黑盒的——RLHF之后模型"看起来"对齐了,但没人知道内部发生了什么。


他创办的公司:暗物智能

学术之外,朱松纯也在做商业化验证。暗物智能(DMAI)成立于2018年,已完成B轮融资。

技术路线:基于"小数据、大任务"认知AI技术范式。

落地场景:

  • 自适应教育(根据学生的认知状态动态调整教学策略)
  • 金融科技(需要因果推理和风险判断的场景)
  • 泛娱乐(需要理解用户意图和情感的交互)

这些场景有一个共同特点:需要深层人机互动、个性化理解、因果推理——恰好是大模型做不好、但认知架构擅长的领域。


人才培养:本博贯通

朱松纯不只做研究,还在重构AI教育:

  • 北京大学元培学院:通用人工智能实验班
  • 清华大学自动化系:因材施教培养计划(通用人工智能方向)
  • 课程定位:"新工科 + 新文科"交叉的通识专业

他亲自逐条审核物理课大纲,确保学生学的不是陈旧知识而是前沿进展。这种对教育的投入说明他在下一盘长棋——如果AGI的路注定漫长,那培养一代人比发一篇论文更重要。

"可能我们这一代人也只是做一个转移和铺垫,但我相信我们终将能够取得像杨振宁先生那样大师级的、领先世界的成就。"


如何评估他的观点

朱松纯的论证体系有三个层次,强度递减:

最强的部分:问题诊断

大模型缺乏因果推理、缺乏内在价值、缺乏自主目标生成、缺乏物理常识——这些不是观点,是可验证的事实。在这一点上,即使是OpenAI的研究员也不会反驳。

中等强度:替代路线的理论自洽性

"认知架构 + 价值驱动 + 因果推理"作为AGI路线,理论上是自洽的。但从理论自洽到工程实现,还有巨大的距离。"通通"在实验室能摆正相框,和在真实世界中表现出通用智能,差了几个数量级的复杂度。

最弱的部分:排他性判断

"大模型不是正确路径"这个结论可能过强。当前的趋势是大模型正在通过tool use、planning、memory、embodiment等外部架构逐步补上他指出的缺陷。最终的AGI系统可能是:大模型提供语言和世界知识的底座 + 类似朱松纯主张的认知架构提供价值驱动和因果推理

也就是说,他可能不是错的,而是不完整的——大模型和认知架构可能不是互斥的,而是互补的。


时间会给出答案

验证朱松纯观点的终极裁判是时间:

  • 如果 scaling + Agent + 具身 = AGI → 他的路径判断错了
  • 如果 scaling 撞墙 + 需要认知架构重构 → 他对了
  • 如果最终路径是大模型底座 + 认知架构上层 → 双方各对一半

无论最终结果如何,他在所有人冲scaling的时代指出了被忽略的结构性缺失。这种在潮流面前的清醒,本身就是值得记录的。

"如果只跟在Deepmind、OpenAI后面跑,永远不可能做出领先世界的成就。"


延伸阅读

  • Stuart Russell 与朱松纯 AAAI SafeAI 对话(2023.02)
  • 北京通用人工智能研究院成果展实录(2024.01)
  • 《Dark Matter of Intelligence》系列论文
  • 暗物智能官网:https://www.dm-ai.cn/
  • TongTest 通用人工智能评级白皮书