![]() | 刘笑宏 |
上海创智学院全时导师 上海交通大学副教授 | |
领域方向:大模型与算法 | |
在多模态生成与评价领域取得了一系列具有国际影响力的原创成果,形成了较为完整的研究体系。首先,在多模态图像生成方面,深度参与了Lumina系列的研发工作,是 Lumina-Image2.0、Lumina-mGPT 与 Lumina-mGPT 2.0 的共同作者之一。Lumina系列在开源社区具有代表性和前沿性,围绕扩散模型与自回归 Transformer 两大技术路线形成了“双线战略”:前者强化图像质量与控制性,后者实现跨任务的统一建模,在 GenEval、DPG、T2I-CompBench 等权威基准中表现优异,并在 GitHub 收获超 2K 星标,受到学术界与产业界的广泛关注。其次,在美学二维码生成方面,率先提出兼具美感与可扫性的二维码生成方法,推动二维码在视觉呈现上的革新。相关成果 Text2QR (CVPR’24)提出了蓝图生成与潜空间优化模块;Face2QR (NeurIPS’24)突破性地实现了人脸保持与美学感知的统一。相关技术已落地“悦目二维码”微信小程序,成为二维码美学化发展的引领性工作。最后,在生成内容的视觉质量与图文一致性评价方面,联合美团提出 Q-Eval-100K 数据集及多模态评价模型 Q-Eval-Score (CVPR’25 Oral)。该成果已在美团广告、外卖等业务中规模化应用,实现 AI 素材日均十万量级自动审核,显著降低成本与周期,同时落地 AGI-Eval 开放平台,为多模态大模型的开发提供可量化、可对比的评价标准。 |