上海创智学院与华东师范大学联合研发的“启创•InnoSpark1.0”中国版教育大模型,不仅是人工智能技术深度赋能教育场景的标志性事件,更是教育数字化转型征程中的关键一步。
“启创•InnoSpark”自主可控大模型专为教育而生,基于国产千问基座自研,深度聚焦教育场景,不仅是知识库,更是智慧导师。该模型旨在解答教育问题,赋能学科教研,助力实现教学育人一体化。相比通用大模型,“启创•InnoSpark”在塑造正确价值观、培养创新思维、实现因材施教方面优势显著,直击教育本质。
现有通用大语言模型在教育场景中常面临专业知识不足、价值观偏差、个性化能力弱、生成内容缺乏创造性等问题。为应对这些挑战,InnoSpark 围绕“专业能力”“价值观对齐”“个性化”“创造力”四大关键维度进行了系统性优化。项目组联合上海市16个区、90余家教委直属单位及中小学校,累计收集22T高质量教育原始数据,通过自动化数据清洗、人机协同数据合成、大规模专家标注,最终形成高质量教育数据,为模型的教育专业性提供坚实保障。
InnoSpark以开源国产大模型Qwen为基座,首先通过大规模私有教育语料进行二次预训练,增强其在教育领域的理解能力。随后,构建了针对特定教育任务和价值观的精调语料,开展监督微调(SFT),显著提升了模型在知识点讲解、引导式教学、跨学科教案生成、情景化出题等任务中的专业表现。
为进一步增强模型在价值观、个性化、创造力的泛化能力,我们构建了奖励模型,并基于Sii-Verl框架实施GRPO强化学习训练,从而在个性化教学、价值观引导、内容创造力方面实现多维提升。为科学评估模型能力,我们自主设计了ELMES(Education Language Model Evaluation System)评测体系,支持面向多任务、多场景的代理编排与自动化评估。ELMES采用模块化YAML配置架构,可扩展、易迭代,能够为教育大模型的发展提供系统性评价依据。
(图:技术框架)
当前发布的 InnoSpark 1.0版本的核心成果和表现:
一是专业能力显著增强:InnoSpark 1.0在“知识点讲解、引导式教学、教案生成、情景化出题”四大核心教育任务中表现优异,能够准确理解教学目标,生成内容专业、逻辑清晰、贴合教学实际,显著提升模型在复杂教育任务中的适应能力。
二是价值观引领深入融合:模型在训练中深度融入中华优秀传统文化与社会主义核心价值观,在知识传授的同时,注重思政渗透与正向引导,具备良好的教育导向性和育人功能。
三是创造力系统激发:InnoSpark围绕创新能力培养目标,通过开放式问题生成、多角度思维引导与真实情境任务设计,支持对学生思维深度与创造力的多维激发,展现出强大的生成灵活性与教育创新潜力。
四是个性化教学能力突出:InnoSpark可根据学生的学段特征、兴趣偏好与知识掌握情况,进行教学策略适配,实现因材施教与个性化学习资源推荐,助力精准教学与全面发展。
启创·InnoSpark(内测版)入口
即日起开放内测,诚邀广大教育工作者参与体验,共同探索智能教育新范式。
启创·InnoSpark开源下载入口
数据清洗管线:https://github.com/sii-research/COCLP.git
启创模型系列:https://huggingface.co/collections/sii-research/innospark-687c9533a8ca0fb33ef57e5a
量化版本:https://huggingface.co/mradermacher/InnoSpark-R-72B-0701-GGUF
Elmes评测平台开源:https://github.com/sii-research/elmes.git