报告时间:2025年6月25日(星期三)10:00
报告地点:翡翠湖校区科教楼A1104会议室
报 告 人:徐英豪 博士、研究科学家
工作单位:蚂蚁金服研究部
举办单位:计算机与信息学院(人工智能学院)
报告简介:
从视觉输入中感知并生成三维世界是人类理解和互动物理环境的基础。尽管计算机视觉在二维场景理解方面取得了显著进展,但仍难以捕捉三维世界的完整空间与动态特性。在本讲座中,我将介绍一种类人三维感知系统,它能从多视角图像中学习理解三维结构,通常无需大量监督。这类系统不仅实现了通用的三维重建与感知,也为生成与操控三维场景提供了基础。进一步地,我将展示如何结合三维建模与生成模型,实现对虚拟场景和智能体的结构化控制,从而推进人工智能在空间推理、交互和环境创作方面的发展,迈向更具人类水平的三维智能。
报告人简介:
英豪,现任蚂蚁金服研究部研究科学家,并于2026年春季即将入职香港科技大学(HKUST)计算机科学与工程系助理教授。此前,他是斯坦福大学计算成像实验室的博士后研究员,师从Gordon Wetzstein教授。他在香港中文大学获得博士学位,师从周博磊教授和林达华教授,并在浙江大学信息工程系获得学士学位。本科期间,曾在加州大学圣地亚哥分校担任访问学生,导师为苏昊教授。研究重点为三维计算机视觉、计算机图形学和生成式人工智能交叉领域。已在CVPR、ICCV、ECCV、SIGGRAPH、SIGGRAPH Asia、ICLR、NeurIPS和ICML等顶级会议发表多篇论文,多次入选Oral或Spotlight presentations,其中一篇论文被提名为2022年CVPR Best Paper Candidate。2024年被评为WAIC Rising Star,2022年获得Snap Fellowship提名。