Back to explorerGenerated with the local CVPR 2026 explorer build

Semantic Topic Tagging Methodology

이 문서는 CVPR 2026 Paper Explorer의 계통도(topic phylogeny)가 어떻게 만들어졌는지 정리한 방법론이다. 초기 키워드 매칭 방식은 폐기하고, 논문별 title과 abstract를 의미론적으로 읽어 최대 3개의 연구분야 태그를 부여했다.

4,070

Papers

4,070

Semantic tagged

Max tags/paper

Unclassified

1. Input

각 논문은 CVPR 2026 paper JSON에서 추출한 title, abstract, type을 기준으로 분류했다. 저자명, 소속, 국가 정보는 topic 판단에 사용하지 않았다.

2. Taxonomy

라벨 체계는 CVML Paper Phylogeny 스타일을 따라 4단계로 고정했다: phylum -> class -> order -> genus. 에이전트는 자유 라벨을 만들지 않고 아래 허용 라벨 중에서만 선택했다.

Phylum	Class	Order	Genus
Multimodal & Language	Vision-Language Models	MLLM Reasoning	VLM / MLLM
Multimodal & Language	Language Grounding	Grounded Understanding	Grounding
Multimodal & Language	Agents	GUI / Web Agents	Agentic AI
Generative Models	Diffusion Models	Image Generation	Diffusion
Generative Models	Video Generation	Temporal Synthesis	Video Generation
Generative Models	Editing & Personalization	Controllable Generation	Image Editing
3D Vision & Geometry	Neural Rendering	Gaussian / NeRF	3D Gaussian Splatting
3D Vision & Geometry	Reconstruction	Surface / Scene Reconstruction	3D Reconstruction
3D Vision & Geometry	Pose & Registration	Camera/Object Pose	Pose Estimation
3D Vision & Geometry	Point Clouds	Point Representation	Point Cloud
Recognition & Classification	Image Classification	Representation Learning	Classification
Recognition & Classification	Retrieval	Image/Text Retrieval	Retrieval
Detection & Tracking	Object Detection	Generic Detection	Detection
Detection & Tracking	Tracking	Object Tracking	Tracking
Segmentation & Dense Prediction	Segmentation	Semantic / Instance Segmentation	Segmentation
Segmentation & Dense Prediction	Depth & Flow	Dense Geometry	Depth / Optical Flow
Video & Motion	Video Understanding	Temporal Reasoning	Video Understanding
Video & Motion	Human Motion	Pose / Motion	Human Motion
Low-level Vision	Restoration	Image Restoration	Restoration
Low-level Vision	Image Quality	Quality Assessment	IQA
Learning Algorithms	Optimization	Training Methods	Optimization
Learning Algorithms	Self-supervised Learning	Pretraining	Self-supervised
Learning Algorithms	Efficient ML	Compression / Pruning	Efficient Models
Robustness & Safety	Robustness	OOD / Domain Shift	Robustness
Robustness & Safety	Security & Safety	Adversarial / Safe AI	Safety
Robotics & Embodied AI	Embodied Agents	Navigation / Manipulation	Embodied AI
Autonomous Driving	Driving Perception	Perception / Planning	Autonomous Driving
Medical & Scientific Imaging	Medical Vision	Clinical Imaging	Medical Imaging
Remote Sensing & Earth	Remote Sensing	Satellite / Aerial	Remote Sensing
Data & Evaluation	Datasets & Benchmarks	Evaluation	Benchmark
Computational Imaging	Sensors & Cameras	Novel Imaging	Computational Imaging

3. Six-Agent Annotation

전체 4,070편을 여섯 구간으로 나누고, 각 에이전트가 자기 구간의 초록을 읽어 독립적으로 분류했다.

Worker	Paper IDs	Papers
Agent 01	1-679	679
Agent 02	680-1358	679
Agent 03	1359-2037	679
Agent 04	2038-2716	679
Agent 05	2717-3395	679
Agent 06	3396-4070	675

4. Decision Rules

키워드가 보인다는 이유만으로 태그하지 않고, 논문의 주된 문제 설정과 기여를 우선했다.
방법론 단어보다 실제 task/domain을 우선했다. 예를 들어 diffusion을 도구로 쓴 medical segmentation 논문은 medical/segmentation 성격을 함께 고려했다.
각 논문은 최소 1개, 최대 3개 topic만 가진다.
여러 분야가 동등하게 중요하면 primary task, application domain, method family 순서로 우선순위를 두었다.
정말 맞는 taxonomy가 없을 때만 Unclassified를 사용했다.

5. Merge Validation

여섯 결과 파일은 scripts/merge_semantic_topics.py로 병합했다. 병합 단계에서 모든 paper id가 정확히 한 번씩 존재하는지, topic 수가 3개 이하인지, 모든 라벨이 허용 taxonomy 안에 있는지 검증했다.

6. Result Snapshot

Top phylum	Tagged paper count
Generative Models	969
Multimodal & Language	967
Learning Algorithms	829
3D Vision & Geometry	788
Robustness & Safety	486
Video & Motion	431
Segmentation & Dense Prediction	381
Recognition & Classification	343
Data & Evaluation	319
Low-level Vision	298
Detection & Tracking	286
Robotics & Embodied AI	267

7. Limitations

이 분류는 논문 원문 전체가 아니라 title과 abstract만 사용한 탐색용 의미론적 태깅이다. 세부 subfield의 미묘한 차이, 저자 의도, 벤치마크 중심 논문과 방법론 중심 논문의 경계는 완벽히 반영하지 못할 수 있다. 따라서 이 계통도는 정밀 bibliometric ground truth라기보다 CVPR 2026 논문군의 연구 흐름을 빠르게 탐색하기 위한 지도에 가깝다.