Back to explorerGenerated with the local CVPR 2026 explorer build

Semantic Topic Tagging Methodology

이 문서는 CVPR 2026 Paper Explorer의 계통도(topic phylogeny)가 어떻게 만들어졌는지 정리한 방법론이다. 초기 키워드 매칭 방식은 폐기하고, 논문별 title과 abstract를 의미론적으로 읽어 최대 3개의 연구분야 태그를 부여했다.

4,070
Papers
4,070
Semantic tagged
3
Max tags/paper
7
Unclassified

1. Input

각 논문은 CVPR 2026 paper JSON에서 추출한 title, abstract, type을 기준으로 분류했다. 저자명, 소속, 국가 정보는 topic 판단에 사용하지 않았다.

2. Taxonomy

라벨 체계는 CVML Paper Phylogeny 스타일을 따라 4단계로 고정했다: phylum -> class -> order -> genus. 에이전트는 자유 라벨을 만들지 않고 아래 허용 라벨 중에서만 선택했다.

PhylumClassOrderGenus
Multimodal & LanguageVision-Language ModelsMLLM ReasoningVLM / MLLM
Multimodal & LanguageLanguage GroundingGrounded UnderstandingGrounding
Multimodal & LanguageAgentsGUI / Web AgentsAgentic AI
Generative ModelsDiffusion ModelsImage GenerationDiffusion
Generative ModelsVideo GenerationTemporal SynthesisVideo Generation
Generative ModelsEditing & PersonalizationControllable GenerationImage Editing
3D Vision & GeometryNeural RenderingGaussian / NeRF3D Gaussian Splatting
3D Vision & GeometryReconstructionSurface / Scene Reconstruction3D Reconstruction
3D Vision & GeometryPose & RegistrationCamera/Object PosePose Estimation
3D Vision & GeometryPoint CloudsPoint RepresentationPoint Cloud
Recognition & ClassificationImage ClassificationRepresentation LearningClassification
Recognition & ClassificationRetrievalImage/Text RetrievalRetrieval
Detection & TrackingObject DetectionGeneric DetectionDetection
Detection & TrackingTrackingObject TrackingTracking
Segmentation & Dense PredictionSegmentationSemantic / Instance SegmentationSegmentation
Segmentation & Dense PredictionDepth & FlowDense GeometryDepth / Optical Flow
Video & MotionVideo UnderstandingTemporal ReasoningVideo Understanding
Video & MotionHuman MotionPose / MotionHuman Motion
Low-level VisionRestorationImage RestorationRestoration
Low-level VisionImage QualityQuality AssessmentIQA
Learning AlgorithmsOptimizationTraining MethodsOptimization
Learning AlgorithmsSelf-supervised LearningPretrainingSelf-supervised
Learning AlgorithmsEfficient MLCompression / PruningEfficient Models
Robustness & SafetyRobustnessOOD / Domain ShiftRobustness
Robustness & SafetySecurity & SafetyAdversarial / Safe AISafety
Robotics & Embodied AIEmbodied AgentsNavigation / ManipulationEmbodied AI
Autonomous DrivingDriving PerceptionPerception / PlanningAutonomous Driving
Medical & Scientific ImagingMedical VisionClinical ImagingMedical Imaging
Remote Sensing & EarthRemote SensingSatellite / AerialRemote Sensing
Data & EvaluationDatasets & BenchmarksEvaluationBenchmark
Computational ImagingSensors & CamerasNovel ImagingComputational Imaging

3. Six-Agent Annotation

전체 4,070편을 여섯 구간으로 나누고, 각 에이전트가 자기 구간의 초록을 읽어 독립적으로 분류했다.

WorkerPaper IDsPapers
Agent 011-679679
Agent 02680-1358679
Agent 031359-2037679
Agent 042038-2716679
Agent 052717-3395679
Agent 063396-4070675

4. Decision Rules

5. Merge Validation

여섯 결과 파일은 scripts/merge_semantic_topics.py로 병합했다. 병합 단계에서 모든 paper id가 정확히 한 번씩 존재하는지, topic 수가 3개 이하인지, 모든 라벨이 허용 taxonomy 안에 있는지 검증했다.

6. Result Snapshot

Top phylumTagged paper count
Generative Models969
Multimodal & Language967
Learning Algorithms829
3D Vision & Geometry788
Robustness & Safety486
Video & Motion431
Segmentation & Dense Prediction381
Recognition & Classification343
Data & Evaluation319
Low-level Vision298
Detection & Tracking286
Robotics & Embodied AI267

7. Limitations

이 분류는 논문 원문 전체가 아니라 title과 abstract만 사용한 탐색용 의미론적 태깅이다. 세부 subfield의 미묘한 차이, 저자 의도, 벤치마크 중심 논문과 방법론 중심 논문의 경계는 완벽히 반영하지 못할 수 있다. 따라서 이 계통도는 정밀 bibliometric ground truth라기보다 CVPR 2026 논문군의 연구 흐름을 빠르게 탐색하기 위한 지도에 가깝다.