“启创•InnoSpark1.0”突破关键技术：打造中国版自主可控教育垂类大模型

2025.08.01阅读量：32

科研进展

上海创智学院与华东师范大学联合研发的“启创•InnoSpark1.0”中国版教育大模型，不仅是人工智能技术深度赋能教育场景的标志性事件，更是教育数字化转型征程中的关键一步。

“启创•InnoSpark”自主可控大模型专为教育而生，基于国产千问基座自研，深度聚焦教育场景，不仅是知识库，更是智慧导师。该模型旨在解答教育问题，赋能学科教研，助力实现教学育人一体化。相比通用大模型，“启创•InnoSpark”在塑造正确价值观、培养创新思维、实现因材施教方面优势显著，直击教育本质。

现有通用大语言模型在教育场景中常面临专业知识不足、价值观偏差、个性化能力弱、生成内容缺乏创造性等问题。为应对这些挑战，InnoSpark 围绕“专业能力”“价值观对齐”“个性化”“创造力”四大关键维度进行了系统性优化。项目组联合上海市16个区、90余家教委直属单位及中小学校，累计收集22T高质量教育原始数据，通过自动化数据清洗、人机协同数据合成、大规模专家标注，最终形成高质量教育数据，为模型的教育专业性提供坚实保障。

InnoSpark以开源国产大模型Qwen为基座，首先通过大规模私有教育语料进行二次预训练，增强其在教育领域的理解能力。随后，构建了针对特定教育任务和价值观的精调语料，开展监督微调（SFT），显著提升了模型在知识点讲解、引导式教学、跨学科教案生成、情景化出题等任务中的专业表现。

为进一步增强模型在价值观、个性化、创造力的泛化能力，我们构建了奖励模型，并基于Sii-Verl框架实施GRPO强化学习训练，从而在个性化教学、价值观引导、内容创造力方面实现多维提升。为科学评估模型能力，我们自主设计了ELMES（Education Language Model Evaluation System）评测体系，支持面向多任务、多场景的代理编排与自动化评估。ELMES采用模块化YAML配置架构，可扩展、易迭代，能够为教育大模型的发展提供系统性评价依据。

（图：技术框架）

当前发布的 InnoSpark 1.0版本的核心成果和表现：

一是专业能力显著增强：InnoSpark 1.0在“知识点讲解、引导式教学、教案生成、情景化出题”四大核心教育任务中表现优异，能够准确理解教学目标，生成内容专业、逻辑清晰、贴合教学实际，显著提升模型在复杂教育任务中的适应能力。

二是价值观引领深入融合：模型在训练中深度融入中华优秀传统文化与社会主义核心价值观，在知识传授的同时，注重思政渗透与正向引导，具备良好的教育导向性和育人功能。

三是创造力系统激发：InnoSpark围绕创新能力培养目标，通过开放式问题生成、多角度思维引导与真实情境任务设计，支持对学生思维深度与创造力的多维激发，展现出强大的生成灵活性与教育创新潜力。

四是个性化教学能力突出：InnoSpark可根据学生的学段特征、兴趣偏好与知识掌握情况，进行教学策略适配，实现因材施教与个性化学习资源推荐，助力精准教学与全面发展。

启创·InnoSpark（内测版）入口

即日起开放内测，诚邀广大教育工作者参与体验，共同探索智能教育新范式。

内侧入口：https://beta.aiecnu.cn

启创·InnoSpark开源下载入口

数据清洗管线：https://github.com/sii-research/COCLP.git

启创模型系列：https://huggingface.co/collections/sii-research/innospark-687c9533a8ca0fb33ef57e5a

量化版本：https://huggingface.co/mradermacher/InnoSpark-R-72B-0701-GGUF

Elmes评测平台开源：https://github.com/sii-research/elmes.git

科研创新

“启创•InnoSpark1.0”突破关键技术：打造中国版自主可控教育垂类大模型