2025年9月11日至13日,上海创智学院举行首届创智未来大会,重磅发布7项AI创新成果,涵盖认知智能、情境智能、具身智能、AI基础设施等科研方向和探索前沿,充分展现学院在人工智能发展上的“尖兵”作用。9月20日起,我们将发布这些成果的深度解读文章,邀您一同感受科技前沿的力量。
过去一年,AI展现了惊人的“思考”能力,但仅能思考还不够。随着智能体浪潮和“人工智能+”战略推进,真正的挑战是让AI走出思想实验,解决现实问题。2025年9月12日,上海创智学院发布突破性成果——“能动”认知智能。这不仅是一项技术,更是一场宣言:推动大模型从“思考者”跃升为“创新者”,赋予AI真正的“能动性”。
一、背景:从“思考”深潜,到“能动”破局
AI大模型的进化之路波澜壮阔。诞生之初,它们是新奇的聊天伴侣,能与人进行流畅对话。而过去一年,以test-time scaling等技术为代表的突破,让大模型真正学会了“深度思考”,其强大的推理能力开始涌现,无论是解决复杂的数学题,还是编写高难度的算法代码,都已不再是天方夜谭。然而,当整个产业界都在为AI的“智商”欢呼时,一个现实瓶颈也随之出现:思考本身并不能直接创造价值,行动才能致远。
这一认知,正与产业发展的脉搏同频共振。以AI智能体为代表的应用正以前所未有的速度发展。与此同时,国家层面的顶层设计也已明确方向。国务院近期发布的《深入实施“人工智能+”行动的意见》指出,目标到2027年,智能体等应用普及率超70%;到2030年,普及率超90%,让智能经济成为我国经济的重要增长极。显然,时代呼唤的,不再是仅仅能坐而论道的“思想家”,而是能够深入百业、解决问题的“实干家”。因此,让AI具备“能动性”,使其能够理解任务、规划路径、调用工具并最终完成目标,成为了通往高价值智能高峰的重要路径。创智学院的“能动”认知智能,正是在这一时代背景下应运而生。
二、第一击:数据即智能——铸造“能动”基石
一个卓越的“能动”智能体,离不开一个强大的“能动”基座模型作支撑。而在大模型的世界里,数据即智能,高质量的“数据燃料”是驱动一切智能的根源。
项目组深刻洞察到,数据工程的优劣,是决定模型能力上限的关键。不同的数据加工工艺——从源头收集、筛选过滤到深度清洗——会对模型的最终表现产生天壤之别的影响。然而,当前大模型在面对科学论文、教科书、代码库等高密度、高逻辑性的知识时,普遍存在“消化不良”的问题。其根源在于,这些数据充满了复杂的数学公式(如LaTeX)、隐含的逻辑前提、跨模态的信息(图表与正文)以及非结构化的行动轨迹(如代码库的演进历史)。为此,团队首创了一套“认知能动数据加工工艺”,这套工艺如同精密的芯片制造流程,通过多步智能化的数据挖掘与处理,将海量的、良莠不齐的原始数据,层层提纯:
认知数据工程:针对科学文献,团队采用专有解析器将PDF等格式中的文本、公式、图表引用关系进行精准提取。考虑到科学知识的晦涩性,团队引入了“AI辅助教学”的数据处理范式。利用强大的教师模型,对核心概念进行“追问式”问答对生成,将一个复杂的定理或原理,拆解成一系列由浅入深的问答;同时,为关键理论生成示例和现实世界类比,极大地降低了模型的学习门槛,将“死记硬背”转变为“理解吸收”。
能动数据工程:为了让模型学会“行动”,团队深入挖掘了GitHub等平台的代码演进历史。通过分析数百万计的Pull Requests,团队不仅提取git diffs,更将其与关联的Issue讨论、Code Review意见进行对齐,构建出[意图(Intent) -> 规划(Plan) -> 行动序列(Action Trace) -> 反思(Reflection)]的完整能动轨迹。这些轨迹被范式化处理,成为教会模型如何从一个问题出发,通过试错、调试、最终达成目标的宝贵教材。
通过这套工艺,超过6500亿Tokens的原始数据被提炼为真正能驱动模型产生认知与能动性的“高品质数据燃料”,从根本上解决了高质量数据“喂不进、吃不透”的行业难题。
三、第二击:科研范式的哥白尼革命——AI从“工具”走向“创新主体”
如果说强大的数据工艺是基础,那么“能动”的AI将如何颠覆世界?项目组给出的答案是:重塑科学发现的范式,让科研从“以人为中心”,转向“以AI为中心”。当前,全球众多顶尖机构和大厂仍在为实现OpenAI定义的五级AGI标准中的第三级——“智能体”而努力。而项目组已经前瞻性地探索让AI真正进行“创新”的可能。
成果一:AI自主发现AI新架构通过创新的AI自主科研框架与人机异步交互界面,团队首次实现了支持AI进行长达数天深度协作的科研模式。在网络架构的自主探索实验中,“能动”AI仅用两天时间,便自主发现了超过100个全新的、超越人类设计的网络架构[3] 。相比之下,一位人类专家平均需要花费2000个小时才能发现一个新模型,且无法有效扩展。这背后,是一条“更多算力,更多发现”的科学发现扩展定律正在被AI验证。
成果二:AI在编程实训中全面超越人类在创智学院举办的多场编程实训比赛中,这套“AI超智能”系统作为特殊选手参与其中,与人类学生同场竞技。结果令人震撼:它在夏令营中超越了100%的人类选手,以排名第一的绝对优势夺冠;在春令营和金秋营中,也分别超越了79%和94%的选手。这标志着,AI已不再是辅助编程的工具,而是具备了独立理解、设计并实现复杂任务的“能动”开发者。
这些成果雄辩地证明,“能动”的AI正从科幻走向现实,成为科学发现与技术创新的全新主体,开启了一场科研领域的“哥白尼革命”。
四、第三击:能动性普惠——让人人皆可拥有“AI钢铁侠”
面对全球各大厂商纷纷推出自家代码智能体与能动基模的激烈竞争格局 ,创智学院的选择不是独善其身,而是普惠大众。团队认为,“能动性”不应是少数巨头的专利,而应成为赋能每个开发者和科研人员的“铠甲” 。为此,项目重磅发布了开源的“创智认知能动套件”,它由两大核心组成:
“AI贾维斯”——开源能动大模型:一个性能卓越的基座模型。该模型践行“Less is more”的设计哲学,为“能动性”进行了深度优化。优化学习如何操作独立的“工作记忆”模块以维持长程任务的上下文,并特别学习“规划与工具调用”接口,使其能更好地学习如何分解任务和使用外部工具。 同时,针对业界缺少有效能动性评测的痛点,团队构建了评估能动性的测试基准[2],包含高质量的需要长链条、多工具协同才能完成的真实世界任务,“AI贾维斯”在此基准上性能卓越,证明了其架构的先进性。
“AI战甲”——认知能动脚手架[1]:这不仅是一个脚手架,更是一个生产级的智能体运行时环境。它提供了一个安全的、统一的API接口,让开发者可以轻松地将自己的API、本地脚本、数据库等封装成AI可调用的工具。同时可以管理智能体每一步的执行状态,支持任务的暂停、断点续传和复盘,极大地方便了开发者对复杂能动任务的调试。此外,自动捕获并结构化用户在实际使用中成功的智能体与工具的交互轨迹。这些高质量的真实世界数据,可直接用于“AI贾维斯”模型的持续迭代优化,形成一个强大的自进化闭环。
这套“创智认知能动套件”旨在赋能千行百业,无论是开发一个App、处理复杂的科学数据,还是作为浏览器助手,都能轻松实现。其目标是为每一位使用者打造一个专属的“钢铁侠”,让强大的“能动”AI能力触手可及。
四、为国育才:不止于技术,更在培育引领未来的AI原生人才
一项伟大的事业,背后必然是人才的崛起。创智学院在推动技术变革的同时,更致力于一场从Research到Product的全栈式AI原生人才培养革命。正如项目负责人所言:“我们不仅在开发下一代AI技术,更在为国家培养能够引领AI未来的原生全栈式人才,为国育才。”
顶尖人才的“虹吸效应”:学院培养的学生已成为全球顶尖AI公司争抢的“香饽饽”,收获了来自Anthropic、DeepSeek、Qwen等公司的核心技术岗位邀请。一名大三本科生更是荣获了象征本科生最高荣誉的2025商汤奖学金。更令人瞩目的是,多名来自复旦、交大、南大等高校的专业第一名,以及海外CMU的优秀硕士,毅然选择加入创智学院深耕认知工程,他们看中的正是这里从理论研究到产品落地的完整价值链。
全球范围的学术与产业影响力:学院的研究成果在开源社区和学术界引发了巨大反响。相关项目在GitHub上累计获得超过5700星标,模型与数据集在Hugging Face上下载量近10万次。多项工作在社交媒体上引发数百万次浏览和热议,核心成果被Meta等巨头邀请分享,并被MIT、斯坦福等上百家顶尖机构广泛使用和推荐。
当我们再次审视AI发展的浪潮,会发现其价值的最终落点,已从“模型能思考多深”决定性地转向了“智能体能行动多远”。这正是“能动性”在当前时代下的核心价值所在。
上海创智学院发布的“能动”认知智能,并非单一的技术点突破,而是通过“高品质数据燃料”的精炼、“AI自主科研”的范式革命以及“开源能动套件”的普惠,系统性地回答了如何为AI注入“行动灵魂”这一关键命题。这场革命的核心,是推动AI从一个等待指令的“响应者”,进化为一个能够自主规划、调用工具、并解决复杂现实问题的“能动者”。
“思考”为AI画出了蓝图,而唯有“能动”,才能将这张蓝图变为现实,将智能真正转化为生产力。这不再是科幻的远景,而是正在发生的变革。当思考开路,行动致远,一个由“能动”AI驱动的创新新纪元,已经到来。
[1] https://www.opensii.ai/cli/
[2] https://agencybench.opensii.ai/
[3] https://arxiv.org/pdf/2507.18074