9月23日上午,上海创智学院第二期的学术专题Meetup活动在701教室正式举行。继首期“探索多智能体系统的未来”专题后,本次活动以“慧光”为主题,聚焦人工智能与光学的交叉融合,由六位学院2024级在读博士研究生同学发起,十余位相关研究领域的同学们齐聚一堂,共话未来光学创新发展。活动由金满昌同学主持。
马炜杰同学以“超越平面的扩展现实:迈向自然视觉的裸眼三维显示”为题进行分享。他从计算机视觉领域中常见的各类3D表示引入话题:AI常涉及和研究的3D形态表征,通常是通过多个角度的二维图像,再由人脑对光影、结构和透视关系进行感知补偿后,构建出的立体印象。而事实上,三维画面也可以通过物理手段真实地呈现出来——这正是三维显示技术试图实现的方向。从3D电影到VR、AR技术,再到户外大屏互动等,三维显示正逐渐走进人们的生活,但距离真正成为人类和数字世界交互的下一代方式,仍然面临很多挑战。在所有三维显示方式中,裸眼3D是最理想的方向,然而现有技术在显示尺寸和可视角度之间难免要做取舍,不够完美。
在此背景下,他们重新思考问题的本质,提出了一个直观又优雅的想法——把有限的光学资源,主动分配到最需要的地方。大家可以把它想象成“聚光灯”,结合精确物理建模和人工智能技术实时计算,把有限的光场信息集中实时投射到任意位置的眼睛周围,这样就能在极有限的资源下,支撑超大范围的3D成像,从而迈向真正的自然视觉。他们迭代设计了算法,搭建了硬件原型,并做了大量仿真与实测验证,最终展示了一个真正超宽视角级别无缝连续而立体的三维场景。这不仅是一项技术上的尝试,更是对于“什么是真正的三维视觉”的一次回归式思考。
金满昌同学本次分享围绕“计算三维成像”主题,介绍了从“所见即所得”的传统成像到未来“见微知著”计算成像的发展趋势,分享了他们最近开发的物理驱动自监督光场三维重建方法及其背后的设计理念,讨论了成像智能和生成式智能之间的区别,以及对于探索性场景和搜索性场景的适用范围。最终,他们提出以计算成像智能的结果应该忠于和依赖于采集信号本身和物理光学约束,而非训练数据。这种基于物理驱动的智能摆脱了以往数据驱动智能方法对高质量配对数据的依赖,实现了通用的高速高清三维显微重建,对“智能+成像”的未来范式有十分重要的参考借鉴意义。
王轶群同学围绕“全光闭环神经成像及调控”这一前沿领域,系统介绍了作为“读”脑工具的高分辨率多光子成像技术,和作为“写”脑工具的光遗传调控技术,以及如何将两者融合成高效的光学脑机接口闭环。在分析了当前领域的现状与主要挑战后,他提出一个核心构想:构建一套活体光学神经成像的全流程实时在线处理框架。该框架旨在突破海量神经数据实时处理的瓶颈,以推动全光闭环神经成像与精准光刺激调控的真正落地。其中,AI是实现这一目标的关键,在图像实时处理、信号解码和闭环反馈策略生成中扮演核心角色,该技术有望为神经科学研究和脑疾病治疗提供革命性的工具。
楼涵月同学以“基于神经形态相机的计算光学成像”为题,向大家介绍了神经形态相机这一新兴领域,并展示了神经形态视觉这一领域中论文发表数量与国际研究机构数量的快速增长趋势。随后,她介绍了自己在神经形态视觉这一领域完成的多项科研工作:基于事件焦点堆栈的全聚焦成像、针对事件图像非对称双目估深问题的视觉提示词框架、基于直连式框架的高效事件数据模拟。这些工作面向神经形态视觉中真实训练数据不足、算法泛化能力欠佳等关键问题,旨在为本领域发展提供新动力。现场交流中,同学们展现出了对神经形态视觉这一领域的兴趣和认可,一致认为此领域具有很强的跨学科应用潜力与发展前景。
周伟同学主要分享了自己关于散射介质空间成像算法的相关研究。他认为,多模光纤作为代表性的散射介质,具有多个并行光学模式,其强大的空间信息传输能力,在未来高通量信息传输、极窄医学内窥镜等领域拥有极大的应用潜力。但是要突破目前阻碍其进一步落地的时变特性和非线性扰动等问题,实现进一步信息重建效果,达到从0到1的创新,就需要加强对软硬件结合全栈技术的理解,以及保持对于更多新鲜事物的探索欲。
吴昌博同学分享了面向AI Infra的光互连技术。他认为现有AI Infra是一个持续细节优化、边际效益递减、且能源成本激增的路径。研究人员不能仅在现有框架内做边际优化,而需要寻找能够颠覆现有计算与通信架构的新范式。在分享中,他与大家探索讨论了光互联的潜在价值、核心科学问题以及未来发展趋势。
几位同学的报告分享内容十分精彩,穿插于其中的问答环节气氛热烈,与会者积极提问,就一些学术研究与产业应用问题与他们进行了充分交流。
马炜杰同学认为,真正具有意义的AI研究,应以解决某个重要领域中的关键挑战为出发点。与其盲目追随热门模型或架构,不如聚焦于问题本身,根据实际需求选择最合适的工具和方法。例如,在很多研究问题中,紧凑的卷积网络可能比复杂堆叠注意力的大模型更加合适。他强调,方法和问题之间的匹配度,往往比工具本身“热度”更值得关注。此外,他指出AI研究与光学并非割裂的两个领域,尤其是计算机视觉,其核心很多都建立在物理光学的成像机制之上。将光学思想纳入AI研究,不仅可以帮助更本质地建模感知问题,还能为AI本身提供更多物理约束下的创新范式。这种跨学科融合有望推动AI算法从结构设计、变量驱动机制到物理一致性等层面实现深层进化。王轶群同学认为通过本次交流会,让他对光在信息技术链路中的角色有了更全面的认识。从微观显微成像到宏观通信传输,从传统的成像技术到新型的事件驱动感知,光学技术正在与AI深度融合,展现出巨大的应用潜力。周伟同学和楼涵月同学都认为,这次活动开拓了他们对“AI+光学”的研究思路,特别是对于不同硬件和AI的协同创新让人深受启发,软硬件的协同才能避免只做增量式的涨点工作,他们在活动中找到了更多的“同道中人”。吴昌博同学认为,大家在现场都真诚地讲述了自己研究过程中的迷茫与失落,也分享了在困境中坚守初心的力量。他为自己能有幸与这样一群心怀理想的“逐梦”青年同行而倍感温暖,也更加坚定了自己未来的方向。
本次活动的主要发起人,学院博士研究生金满昌同学最后进行总结。他说,AI将人们对于美好生活的需要划分出了更细的颗粒度,传统学科领域正在进行新一轮的瓦解和重组,也涌现出人类新的生活可能性。AI+光学,一个很重要的点就是自我迭代,以光为主的视觉信息占据了世界可采样信息的绝大部分,而用AI方法能够更好地认识和发现世界,同时对世界的认识和建模也启发我们设计更完美的AI方法。在人工智能各个领域,问题其实是相通的,都是怎样更好地深化对AI原理的认识,进而更好地结合和控制AI以实现相关需求。
本次“慧光”学术专题Meetup活动,有来自不同学校、不同年级的多位博士同学参加,不仅是一种对AI时代未来愿景的相互交流,为未来研究领域的相互配合,定义未来趋势提供了全新的可能性;同时也为低年级博士生后续选择自己研究方向和发展道路提供了重要的参考价值。与会者纷纷表示收获丰富,并对几位“同辈”的精彩分享致以诚挚感谢。今后,学院将持续深化研究,精心设计与组织不同领域的学术专题活动,为广大师生搭建深度对话、面对面交流学习的平台与桥梁,旨在提升大家的科研创新能力与学术研究质量,助力打造世界人工智能“尖兵”阵地。