今天(11月30日),计算机科学最高荣誉 ACM 图灵奖得主、强化学习之父Richard Sutton 教授到访上海创智学院,做客创智讲坛第12期,与学院师生展开了一场别开生面的交流。

活动开始前,Richard Sutton教授参观了学院成果,与各项目的师生代表进行交流。


本期创智讲坛由学院副院长乔宇主持,副院长卢策吾、全时导师邱锡鹏、刘鹏飞、温颖同台而坐,与Richard Sutton 教授一起聚焦AI发展,从研究方向、大语言模型、智能的本质等多个方面展开探讨。

“Ideas Matter”
Richard Sutton强调idea对于AI科研的发展至关重要。Idea的产生并不依赖超大规模的计算资源,而应当将重心放在generating ideas上。进行第一性原理思考,避免盲目跟随趋势,养成定期记录想法的习惯。他提到科研中 90% 的工作可能是浪费时间,但研究的意义在于不断寻找,要接受大多数尝试都会失败的事实,要保持开放心态。
“The Bitter Lesson”
在Richard Sutton看来,当今研究者们试图将人类知识构建到系统中,虽然这样的方法短期内确实能带来提升,但长期来看会被更通用、更依赖计算力和数据的方法超越。他将其称之是一种“苦涩的教训”,并指出AI的真正进步来自计算规模与通用学习算法,而不是人类知识的注入;我们不应依赖人工设计的知识,而需要构建能从原始经验中自主学习的系统。

LLM可能只是AGI的“10%解决方案”
针对当前火热的LLM议题,Richard Sutton指出,LLM是一项重大突破,但它或许只解决了通往AGI拼图中的10%。他进一步阐释,当前大模型在训练后权重被“冻结”,缺乏真正的持续学习能力,只是“好的解题者,而不是好的提问者”。

AI的关键能力是达成目标的计算能力
在定义智能本质时,Richard Sutton认为智能(Intelligence)某种程度上可以看作“the temporal derivative of knowledge”,强调智能不是知识的静态存量,需要具备目标(goal),可以生成自己的目标和子问题,需要具备从自身经验(experience)中获取新知识和达成目标的计算能力。当前从经验中学习面临的核心挑战之一在于如何从“low-level experience”学会“high-level knowledge”。

在观众提问环节中,Richard Sutton教授认真倾听每一位老师和同学的提问,给予了真诚而富有启发性的回答,这也将整场活动的互动氛围推向了顶峰。

最后,党委书记、常务副院长丁晓东代表学院向Richard Sutton教授赠送了纪念铭牌并对他的精彩分享表示感谢。

活动结束,同学们依然热情不减,簇拥在Richard Sutton教授身旁,踊跃交流、签名留念。



Richard Sutton 简介
Richard Sutton是计算机科学最高荣誉ACM图灵奖获得者,他在阿尔伯塔大学与Keen Technologies从事人工智能与强化学习算法的教学与设计工作,并担任阿尔伯塔机器智能研究所首席科学顾问及加拿大CIFAR人工智能讲席教授。早年曾就读于斯坦福大学与马萨诸塞大学,先后任职于GTE实验室、AT&T实验室和DeepMind公司。其学术论著被引用约17万次,其中包含强化学习领域的奠基性教材。
