何军军,目前主要研究方向为多模态理解、多模态生成、多模态生成理解一体化,以及多智能体及其在医学领域的应用。谷歌学术引用1.1万余次,H指数46,入选斯坦福大学全球前2%顶尖科学家榜单,荣获2025 MICCAI Best Paper and Young Scientist Awards Shortlist和MICCAI 2025 Best Workshop Paper Award。在国际挑战赛中获得10余项奖项,其中6项冠军。担任上海人工智能实验室通用医疗GMAI团队负责人,带领团队在医疗AI领域构建并开源了多个大规模基准数据集和高性能模型。代表性成果包括:3D医学影像预训练模型STU-Net,医学影像分割基础模型SAM-Med2D和SAM-Med3D,大规模系统化医学多模态评测基准OmniMedVQA与GMAI-MMBench,通用医疗多模态大模型GMAI-VL,超大分辨率病理WSI多模态大模型SlideChat,以及大规模眼底彩照生成模型RetinaLogos和眼科手术视频生成模型Ophora等。近期,团队开源项目Project Imaging-X(大规模医学影像数据综述与开源开放共享平台)在国内外引起广泛关注。此外,还参与了通用多模态大模型InternVL、科学多模态大模型Intern-S1,以及生成理解一体化模型Lumina-Dimoo等重要项目的研发工作。
