인공지능(AI) 및 생성형 인공지능/AI 이슈 및 동향

1월 2주차 AI 주요 논문 정리

최술사 2026. 1. 29. 14:57

1. GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization
   - Upvotes: 125
   - [논문 보기](https://huggingface.co/papers/2601.05242)
   - 이 논문은 다중 보상 강화 학습(RL)을 위한 정책 최적화 방법인 GDPO를 제안한다. 각 집단의 보상을 분리하여, 보다 효과적인 학습과 성과 향상을 목표로 한다.

2. NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos
   - Upvotes: 107
   - [논문 보기](https://huggingface.co/papers/2601.00393)
   - NeoVerse는 현장 모노큘러 비디오를 활용하여 4D 세계 모델을 향상시키는 방법을 제시한다. 이는 복잡한 환경에서도 유용한 모델을 구축하는 데 도움을 줄 수 있다.

3. Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization
   - Upvotes: 107
   - [논문 보기](https://huggingface.co/papers/2512.24615)
   - Youtu-Agent는 자동 생성과 혼합 정책 최적화를 통해 에이전트의 생산성을 향상시키는 방법을 제안한다. 이는 복잡한 의사결정 과정에서의 효율성을 높일 수 있다.

4. InfiniDepth: Arbitrary-Resolution and Fine-Grained Depth Estimation with Neural Implicit Fields
   - Upvotes: 93
   - [논문 보기](https://huggingface.co/papers/2601.03252)
   - InfiniDepth는 신경적 암묵적 필드를 활용하여 임의 해상도 및 세밀한 깊이 추정을 수행하는 방법을 제안한다. 이는 3D 사실성의 향상에 크게 기여할 수 있다.

5. LTX-2: Efficient Joint Audio-Visual Foundation Model
   - Upvotes: 86
   - [논문 보기](https://huggingface.co/papers/2601.03233)
   - LTX-2는 오디오-비주얼 통합 관점에서의 보다 효율적인 모델 생성을 목표로 하며, 이는 다양한 멀티모달 학습에 적용될 수 있다.

6. Entropy-Adaptive Fine-Tuning: Resolving Confident Conflicts to Mitigate Forgetting
   - Upvotes: 86
   - [논문 보기](https://huggingface.co/papers/2601.02151)
   - 이 연구에서는 엔트로피 적응 세부 조정을 통해 강한 확신의 갈등을 해결하고 잊어버림을 완화하는 방법을 제안한다. 이는 지속적인 학습에 있어 중요한 접근 방식이 될 수 있다.

7. K-EXAONE Technical Report
   - Upvotes: 78
   - [논문 보기](https://huggingface.co/papers/2601.01739)
   - K-EXAONE에 대한 기술 보고서로, API와 함께 해당 프로젝트의 기능과 설계 원칙을 상세히 기술하고 있다.

8. Evolving Programmatic Skill Networks
   - Upvotes: 70
   - [논문 보기](https://huggingface.co/papers/2601.03509)
   - 이 논문은 프로그래밍 기술 네트워크의 발전을 다루며, 자율적이고 적응성이 뛰어난 기술 습득에 대한 통찰을 제공한다.