![]() | 陈露 |
上海创智学院全时导师 上海交通大学副研究员 | |
领域方向:AI基础理论与科学智能 | |
大模型通过使用超大规模模型参数和海量数据进行训练,涌现出很强的上下文学习能力和思维链推理能力,在人机对话、智能问答、文学创作、辅助编程等任务上虽然取得了广泛的应用,但是在实际应用中仍然面临中训练推理资源消耗大、可靠性不足等核心问题。近3年候选人围绕构建高效高可靠的对话式大模型展开研究,取得系列研究及应用成果:(1)基于类脑认知启发,发现了大模型的功能分区特性和语言对齐机制,提出了系列高效训练推理算法和可靠性对齐框架,降低了大模型实际应用中的资源消耗,缓解了大模型的知识幻觉和工具使用幻觉;(2)研发了DFM系列对话大模型,相关技术已成功在汽车智能座舱、智能家居、智慧教育、科学研究等领域取得大范围应用,获得央视新闻联播报道;(3)在DFM通用大模型基础上研发并开源了ChemDFM系列科学大模型,已被人工智能、化学、材料、生物医药等不同领域研究者下载6万余次,ChemDFM工作发表后的次月Cell子刊Patterns上发表专门评论文章总结了该工作的核心贡献以及对通用化学智能发展的重要影响。 |