Semantic Topic Tagging Methodology
이 문서는 CVPR 2026 Paper Explorer의 계통도(topic phylogeny)가 어떻게 만들어졌는지 정리한 방법론이다. 초기 키워드 매칭 방식은 폐기하고, 논문별 title과 abstract를 의미론적으로 읽어 최대 3개의 연구분야 태그를 부여했다.
1. Input
각 논문은 CVPR 2026 paper JSON에서 추출한 title, abstract, type을 기준으로 분류했다. 저자명, 소속, 국가 정보는 topic 판단에 사용하지 않았다.
2. Taxonomy
라벨 체계는 CVML Paper Phylogeny 스타일을 따라 4단계로 고정했다: phylum -> class -> order -> genus. 에이전트는 자유 라벨을 만들지 않고 아래 허용 라벨 중에서만 선택했다.
| Phylum | Class | Order | Genus |
|---|---|---|---|
| Multimodal & Language | Vision-Language Models | MLLM Reasoning | VLM / MLLM |
| Multimodal & Language | Language Grounding | Grounded Understanding | Grounding |
| Multimodal & Language | Agents | GUI / Web Agents | Agentic AI |
| Generative Models | Diffusion Models | Image Generation | Diffusion |
| Generative Models | Video Generation | Temporal Synthesis | Video Generation |
| Generative Models | Editing & Personalization | Controllable Generation | Image Editing |
| 3D Vision & Geometry | Neural Rendering | Gaussian / NeRF | 3D Gaussian Splatting |
| 3D Vision & Geometry | Reconstruction | Surface / Scene Reconstruction | 3D Reconstruction |
| 3D Vision & Geometry | Pose & Registration | Camera/Object Pose | Pose Estimation |
| 3D Vision & Geometry | Point Clouds | Point Representation | Point Cloud |
| Recognition & Classification | Image Classification | Representation Learning | Classification |
| Recognition & Classification | Retrieval | Image/Text Retrieval | Retrieval |
| Detection & Tracking | Object Detection | Generic Detection | Detection |
| Detection & Tracking | Tracking | Object Tracking | Tracking |
| Segmentation & Dense Prediction | Segmentation | Semantic / Instance Segmentation | Segmentation |
| Segmentation & Dense Prediction | Depth & Flow | Dense Geometry | Depth / Optical Flow |
| Video & Motion | Video Understanding | Temporal Reasoning | Video Understanding |
| Video & Motion | Human Motion | Pose / Motion | Human Motion |
| Low-level Vision | Restoration | Image Restoration | Restoration |
| Low-level Vision | Image Quality | Quality Assessment | IQA |
| Learning Algorithms | Optimization | Training Methods | Optimization |
| Learning Algorithms | Self-supervised Learning | Pretraining | Self-supervised |
| Learning Algorithms | Efficient ML | Compression / Pruning | Efficient Models |
| Robustness & Safety | Robustness | OOD / Domain Shift | Robustness |
| Robustness & Safety | Security & Safety | Adversarial / Safe AI | Safety |
| Robotics & Embodied AI | Embodied Agents | Navigation / Manipulation | Embodied AI |
| Autonomous Driving | Driving Perception | Perception / Planning | Autonomous Driving |
| Medical & Scientific Imaging | Medical Vision | Clinical Imaging | Medical Imaging |
| Remote Sensing & Earth | Remote Sensing | Satellite / Aerial | Remote Sensing |
| Data & Evaluation | Datasets & Benchmarks | Evaluation | Benchmark |
| Computational Imaging | Sensors & Cameras | Novel Imaging | Computational Imaging |
3. Six-Agent Annotation
전체 4,070편을 여섯 구간으로 나누고, 각 에이전트가 자기 구간의 초록을 읽어 독립적으로 분류했다.
| Worker | Paper IDs | Papers |
|---|---|---|
| Agent 01 | 1-679 | 679 |
| Agent 02 | 680-1358 | 679 |
| Agent 03 | 1359-2037 | 679 |
| Agent 04 | 2038-2716 | 679 |
| Agent 05 | 2717-3395 | 679 |
| Agent 06 | 3396-4070 | 675 |
4. Decision Rules
- 키워드가 보인다는 이유만으로 태그하지 않고, 논문의 주된 문제 설정과 기여를 우선했다.
- 방법론 단어보다 실제 task/domain을 우선했다. 예를 들어 diffusion을 도구로 쓴 medical segmentation 논문은 medical/segmentation 성격을 함께 고려했다.
- 각 논문은 최소 1개, 최대 3개 topic만 가진다.
- 여러 분야가 동등하게 중요하면 primary task, application domain, method family 순서로 우선순위를 두었다.
- 정말 맞는 taxonomy가 없을 때만
Unclassified를 사용했다.
5. Merge Validation
여섯 결과 파일은 scripts/merge_semantic_topics.py로 병합했다. 병합 단계에서 모든 paper id가 정확히 한 번씩 존재하는지, topic 수가 3개 이하인지, 모든 라벨이 허용 taxonomy 안에 있는지 검증했다.
6. Result Snapshot
| Top phylum | Tagged paper count |
|---|---|
| Generative Models | 969 |
| Multimodal & Language | 967 |
| Learning Algorithms | 829 |
| 3D Vision & Geometry | 788 |
| Robustness & Safety | 486 |
| Video & Motion | 431 |
| Segmentation & Dense Prediction | 381 |
| Recognition & Classification | 343 |
| Data & Evaluation | 319 |
| Low-level Vision | 298 |
| Detection & Tracking | 286 |
| Robotics & Embodied AI | 267 |
7. Limitations
이 분류는 논문 원문 전체가 아니라 title과 abstract만 사용한 탐색용 의미론적 태깅이다. 세부 subfield의 미묘한 차이, 저자 의도, 벤치마크 중심 논문과 방법론 중심 논문의 경계는 완벽히 반영하지 못할 수 있다. 따라서 이 계통도는 정밀 bibliometric ground truth라기보다 CVPR 2026 논문군의 연구 흐름을 빠르게 탐색하기 위한 지도에 가깝다.