北大王选所陈文拯团队在超大规模城市三维重建上取得重要进展
发布时间:2026-03-26
发布时间:2026-03-26
构建高精度、逼真的 3D 城市模型是推动下一代 3A 大作(如《GTA 6》)、低空经济(如无人机送货航线规划)以及特大城市应急响应系统数字底座等实际应用中急需解决的关键问题。传统的城市建模通常需要数百人耗时数年手工完成,或动用昂贵的专业设备扫描。针对低成本、高效率的“实体都市”数字复刻难题,北京大学王选计算机研究所陈文拯助理教授团队联合北京大学智能学院陈宝权教授团队、高德地图近期取得了一系列重要进展,提出了全新的生成式摄影测量方案 Orbit2Ground。

图1 逼真的3D城市模型演示
相关研究成果《From Orbit to Ground: Generative City Photogrammetry from Extreme Off-Nadir Satellite Images》已在三维视觉与计算机图形学领域引起广泛关注,为大规模城市级数字资产的生成提供了革命性的低成本解决方案。
核心突破一:基于 Z-Monotonic SDF 的几何非凹约束
针对卫星图像视角严重自顶向下,难以重建建筑物外立面并导致近地视角伪影的问题,团队提出了 Z-Monotonic SDF (Z 轴单调符号距离场)。通过引入绝大多数城市建筑墙壁平整外凸的先验结构特性,该方法约束 SDF 场在 Z 轴方向上单调递增,强制从屋顶向下“拉伸”出连续、闭合的完整墙壁,从根本上解决了传统多视角立体视觉(MVS)在处理侧面几何时遭遇的几何崩塌和“空心楼”难题。

图2 Z-Monotonic SDF 约束原理
核心突破二:基于扩散模型先验的确定性纹理精修
由于大气干扰和分辨率限制,稀疏卫星图像拍摄的侧面纹理往往模糊不清。针对此问题,团队基于 FLUX 模型,训练了一个专门的确定性纹理修复网络。该网络利用学习到的海量城市外观知识,对模糊立面进行确定性修复,避免了生成式 AI 常见的鬼影和随机性问题。在近距离的地面视角下,Orbit2Ground 生成的建筑立面纹理清晰可辨,大幅提升了画面的真实感。

图3 Orbit2Ground 方法流程与重建效果
核心突破三:标准物理网格与通用引擎的无缝对接
与目前流行的 NeRF 或 3DGS 等“云雾状”表达不同,Orbit2Ground 最终输出的是标准的 Mesh (网格) 模型。这意味着开发者可以直接在这些模型上添加刚体碰撞、进行物理模拟(如降雪堆积、洪水淹没)及光照渲染。该方案不仅“看得清”,而且真正“用得上”,可直接导入 Unity、Unreal Engine 5 等主流数字引擎。

图4 Orbit2Ground 物理模拟
仅凭少数卫星图,Orbit2Ground重建出高清的三维城市, 展现了碾压级的视觉效果:

图5 逼真的3D城市模型演示
除上述代表性突破外,陈文拯博士团队近期在三维视觉方向上取得了如下主要研究成果与应用:团队在过去一年围绕超大规模、超高精度三维重建研究方向取得了系列突破,共发表顶级会议期刊论文12篇,包括通讯作者CCF-A类论文9篇。相关成果发表于CVPR、NeurIPS、SIGGRAPH等人工智能领域国际顶级期刊和会议。
依托上述 Orbit2Ground 核心技术构建的三维卫星地图,已正式部署于高德实际业务中。该系统支持仅输入3张卫星图像,即可实现4平方公里(4km^2)的高质量三维城市网格全自动重建。目前已覆盖中国8个核心城市(北京、广州、深圳、武汉、长沙、青岛、重庆、成都)的主城区,建成了超过1万平方公里的三维卫星地图。
|
陈文拯,北京大学王选计算机研究所助理教授、博导、研究员,入选北京大学博雅青年学者。 国家优青(海外)、北京市海外人才计划、中国科协青年托举计划获得者。博士毕业于多伦多大学,师从英伟达副总裁 Sanja Fidler 教授。主要研究领域为三维视觉与计算摄影,致力于赋予计算机像人一样对现实世界的三维感知、理解与交互能力。已在顶级学术期刊会议发表论文40余篇,谷歌学术引用超过4200次。担任CVPR,NeurIPS,SIGGRAPH等顶级会议程序委员及领域主席。研究成果已被 NVIDIA Omniverse、Snapchat、高德地图等工业界平台广泛应用。 |
上一篇:【新闻转载】科学家精神百场讲坛走进浪潮集团 感悟“当代毕昇”王选的赤子情怀 下一篇:王选所王勇涛课题组取得多项智能驾驶技术新进展

