1. 목표
단순히 VGGT가 제목이나 초록에 들어간 논문만 모으면 feed-forward visual geometry 주변부는 잡히지만,
CVPR 2026의 3D reconstruction 전체 동향은 놓친다. 그래서 이 분석은 VGGT를 하나의 검색어가 아니라
feed-forward geometry로 재편되는 3D reconstruction을 읽는 렌즈로 사용했다.
2. 처리 파이프라인
데이터는 공개 explorer HTML 안의 <script id="app-data" type="application/json"> 블록에서 직접 추출했다.
각 논문에 대해 제목, 초록, primary phylum, primary genus, topics를 합친 텍스트를 만들고, 여러 검색어 군을 동시에 적용했다.
3. 검색어 설계
검색어는 단일 키워드가 아니라 서로 겹치는 analytical lens로 구성했다. 한 논문이 여러 그룹에 걸리면, 그 논문은 블로그에서 cluster를 연결하는 bridge 후보가 된다.
| 그룹 | 의도 | 대표 검색어 |
|---|---|---|
| VGGT / feed-forward geometry | VGGT 이후 visual geometry foundation model 흐름 탐지 | VGGTvisual geometryfeed-forward reconstructionpoint mapDUSt3RMASt3R |
| General reconstruction / multiview | 전통적인 3D reconstruction, SfM/MVS, multi-view 계열 포착 | 3D reconstructionmulti-viewSfMMVSbundle adjustmentregistration |
| Gaussian / radiance field | 3DGS, NeRF, view synthesis가 map/scene representation으로 확장되는 흐름 탐지 | Gaussian3DGSsplattingradiance fieldNeRFnovel view |
| Pose / calibration / localization | metric system으로 갈 때 남는 pose, calibration, localization 병목 탐지 | camera posepose estimationcalibrationlocalizationSLAM |
| Dynamic / 4D | static reconstruction을 넘어 dynamic scene, streaming, 4D로 가는 흐름 탐지 | 4Ddynamic scenedeformabletemporalstreaming 3D |
| Mapping / autonomous / embodied | reconstruction이 visual asset이 아니라 world model이나 map으로 쓰이는 흐름 탐지 | mappingactive mappingautonomous drivingBEVworld modelembodied |
4. 분류와 점수화 방식
4.1 자동 태깅 필드
| 필드 | 의미 | 예시 |
|---|---|---|
matched_groups | 논문이 걸린 검색/해석 클러스터 | vggt_lineage, gaussian_radiance, dynamic_4d |
inputs | 논문이 가정하는 입력 regime | single image, sparse multi-view, video, panorama, LiDAR/driving |
outputs | 논문이 만드는 출력 representation | camera pose, depth, point map, Gaussian map, mesh/surface, occupancy, 4D scene |
claims | 논문이 주장하는 기여 유형 | foundation/prior, unified pipeline, efficiency, scale, robustness, dynamic, benchmark/data |
score | 검색 그룹 가중치, 3D Vision taxonomy, cross-cluster 정도를 합친 전략 점수 | 0-100으로 clipping |
editorial_bucket | 블로그에서 사용할 역할 | thesis anchor, bridge, representative, adjacent context |
4.2 3단계 필터
| 단계 | 결과 수 | 목적 | 해석 |
|---|---|---|---|
| Broad candidates | 1,417 | 최대한 놓치지 않는 감시망 | false-positive가 꽤 있음. trend radar 용도. |
| Strict reading candidates | 864 | 3D geometry/reconstruction 중심으로 좁힌 분석 모집단 | 블로그 재료 풀. 여전히 전부 읽을 필요는 없음. |
| Blog seed list | 178 | 1차 정독 우선순위 | A/B bucket 중심으로 대표 논문을 quota 기반 추출. |
| Curated relevance pass | 436 | 최종 리포트의 중심 근거 | 864 strict 후보를 다시 core reconstruction 362, strong bridge 74, adjacent 223, likely noise 205로 재분류. |
5. 결과
5.1 Strict 후보의 클러스터 분포
| 클러스터 | 논문 수 | 상대 규모 |
|---|---|---|
| General 3D reconstruction / multiview | 592 | |
| Mesh / surface / implicit / occupancy | 561 | |
| Dataset / benchmark / evaluation | 425 | |
| Gaussian / radiance field / view synthesis | 333 | |
| Dynamic / 4D reconstruction | 271 | |
| Depth / stereo / dense correspondence | 267 | |
| Pose / calibration / localization | 256 | |
| Mapping / autonomous / embodied | 251 | |
| 3D generation / editing bridge | 151 | |
| VGGT / feed-forward geometry | 67 |
5.2 Editorial bucket 분포
| Bucket | Strict 후보 수 | Seed list 수 | 블로그에서의 역할 |
|---|---|---|---|
| A. thesis anchor: representation shift | 159 | 35 | Gaussian/radiance/representation 전환을 설명하는 핵심 근거 |
| A. thesis anchor: VGGT/feed-forward geometry | 67 | 30 | VGGT 이후 feed-forward geometry 흐름의 중심 근거 |
| A. thesis anchor: dynamic/4D recon | 40 | 30 | static 3D에서 dynamic/4D로 이동하는 pressure test |
| B. bridge: reconstruction becomes mapping/world model | 33 | 25 | robotics/SLAM 관점으로 연결하는 다리 |
| B. bridge: representation meets metric pose | 13 | 13 | 3DGS/representation과 pose/localization reliability의 접점 |
| C. cluster representative | 284 | 35 | 각 섹션의 예시 논문 |
| D. adjacent but useful context | 268 | 10 | 주변부 맥락 또는 false-positive 확인용 |
5.3 강한 cross-cluster 신호
| Cross-cluster | 논문 수 | 해석 |
|---|---|---|
| General reconstruction + surface/occupancy | 455 | 3D reconstruction이 mesh, surface, occupancy 같은 explicit representation과 강하게 엮임. |
| Gaussian/radiance + general reconstruction | 228 | 3DGS/NVS가 단순 rendering을 넘어 reconstruction 문제의 중심 표현으로 이동. |
| Dynamic/4D + general reconstruction | 202 | static scene에서 moving scene, temporal consistency, 4D reconstruction으로 확장. |
| General reconstruction + robotics mapping | 141 | visual reconstruction과 map/world model 사이의 연결이 늘어남. |
| General reconstruction + pose/calibration/localization | 126 | real system으로 가는 데 pose와 metric consistency가 병목으로 남아 있음. |
| Dynamic/4D + Gaussian/radiance | 112 | Gaussian 계열이 dynamic scene representation으로 확장되는 흐름. |
6. Seed list 예시
A. VGGT / feed-forward geometry
- Dynamic Visual SLAM using a General 3D Prior
- DynamicVGGT: Learning Dynamic Point Maps for 4D Scene Reconstruction in Autonomous Driving
- E-RayZer: Self-supervised 3D Reconstruction as Spatial Visual Pre-training
- FRM: Linear-Time 3D Reconstruction via Test-Time Training
- OmniVGGT: Omni-Modality Driven Visual Geometry Grounded Transformer
A. Representation shift
- 3D Gaussian Splatting with Self-Constrained Prior for High Fidelity Surface Reconstruction
- AeroGS: Scale-Aware Gaussian Splatting for Pose-Free Dynamic UAV Scene Reconstruction
- AnchorSplat: Feed-Forward 3D Gaussian Splatting With 3D Geometric Priors
- BA-GS: Bayesian Adaptive Gaussian Splatting for SFM-Free 3D Reconstruction
- Energy-GS: Image Energy-guided Pose Alignment Gaussian Splatting with redesigned pose gradient flow
A. Dynamic / 4D reconstruction
- 4D Primitive-Mache: Glueing Primitives for Persistent 4D Scene Reconstruction
- CARI4D: Category Agnostic 4D Reconstruction of Human-Object Interaction
- Catch Me if You Can: Active Mapping of Moving 3D Objects
- Complet4R: Geometric Complete 4D Reconstruction
- Revisiting Monocular SLAM with Spatio-Temporal Scene Modeling
B. Metric pose / mapping bridge
- AERGS-SLAM: Auto-Exposure-Robust Stereo 3D Gaussian Splatting SLAM
- Flow4DGS-SLAM: Optical Flow-Guided 4D Gaussian Splatting SLAM
- ODGS-SLAM: Omnidirectional Gaussian Splatting SLAM
- DROID-SLAM in the Wild
- Dual-Agent Reinforcement Learning for Adaptive and Cost-Aware Visual-Inertial Odometry
7. 해석
결과적으로 VGGT만 보면 67편 규모의 feed-forward geometry 주변 논문을 볼 수 있지만,
CVPR 2026의 3D reconstruction 변화는 그보다 넓다. 더 큰 신호는 Gaussian/radiance field가 reconstruction representation으로 확장되고,
dynamic/4D reconstruction이 static reconstruction의 다음 평가 축이 되며, pose/calibration/localization이 실제 시스템화를 위한 reliability layer로 남아 있다는 점이다.
블로그의 좋은 구조는 논문 리스트가 아니라 field movement를 설명하는 방식이다. 즉 “좋은 논문 몇 개”를 고르는 것이 아니라, 어떤 논문이 중심 thesis를 만들고, 어떤 논문이 bridge 역할을 하며, 어떤 논문은 지엽적이지만 남은 병목을 보여주는지 분리해야 한다.
8. 산출물 링크
생성 스크립트: process_cvpr2026_3d_recon.py. 원본 JSON snapshot은 data/cvpr2026_app_data.json에 저장되어 있다.