当前位置: 首页 > 学术报告 > 正文

基于可学习结构先验的3D视觉感知和推理

发布时间:2024-04-29 09:25:44 发布人:唐振东  

报告人:朱宏远 研究员

报告时间:5月10日(周五)上午10:00 ─ 11:00

报告地点:西山校区 四海楼-602

报告摘要:探讨如何利用3D场景中的结构先验,以促进基于弱监督、少样本监督和set-to-set学习的3D场景感知和推理。首先回顾存在于3D视觉存在的结构先验,强调其在处理复杂场景中的重要性。通过结合最新的机器学习技术,提出了一系列新颖的方法从有限的标注数据中学习和建模3D先验,从而实现对复杂3D环境的高效解释和推理。研究表明,基于可学习结构先验的3D视觉感知和推理为处理复杂的3D环境提供了一种强大而灵活的视角,为开发更先进的3D视觉应用开拓思路。

报告人简介:朱宏远博士是新加坡科学技术研究局信息通信研究所的高级科学家和项目负责人。2015年在IEEE Fellow蔡建飞教授和Nadia Thalmann教授的指导下于南洋理工大学获得博士学位。朱博士在新科研领导先进感知与推理实验室,研究超大规模多模态机器学习、检索和推理,其研究成果先后应用于制造、网络安全等。2023年,被斯坦福大学选为前2%的科学家,并在2022年获得了ASTAR职业奖。其带领团队赢得ICCV2023 Scene2Cap挑战的第一名,EPIC-Kitchen 2022文本视频检索第三名,在2021年是唯一在KUKA创新挑战赛中获得第一名决赛入围奖的亚洲团队。自2020年以来担任《Visual Computer》副主编,ACM MM Asia 2022的区域主席,IJCAI 2021的高级程序委员会成员,以及2018年IET图像处理的客座编辑。目前,已发表了大约90篇顶级期刊和会议论文,谷歌引用达到3600次。

信息科学技术学院

2024年4月29日