AI 13

2월 6일 AI 주요 논문

1. RISE-Video: Can Video Generators Decode Implicit World Rules? - RISE-Video는 텍스트-이미지-비디오 합성 모델을 평가하기 위한 새로운 벤치마크를 제시합니다. 시각적 충실도보다는 인지적 추론에 중점을 두고 있으며, 다차원 메트릭 시스템과 자동화된 LMM 기반 평가를 사용합니다. - [자세한 내용](https://arxiv.org/abs/2602.05986)2. Steering LLMs via Scalable Interactive Oversight - Scalable Interactive Oversight 프레임워크는 복잡한 작업을 관리 가능한 의사 결정 나무로 분해하여 AI 시스템의 인간 감독 및 정렬을 강화합니다. - [..

2월 5일 AI 주요 논문

1. Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization - KV 캐쉬 메모리의 한계를 극복하기 위해 의미 기반 스무딩과 점진적인 잔차 양자화를 활용하며, 메모리 사용량을 대폭 줄이는 동시에 지연 시간을 최소화함. - [논문 링크](https://arxiv.org/abs/2602.02958)2. SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation - 부드러운 몸체 조작을 위한 3D 가우시안 스플랫 시뮬레이터로, 변형 동역학, 환경 힘 및 로봇 동작을 통합된 잠재 신경 공간에서 결합하여 안정적이고 긴 시간 조작을 ..

2월 4일 AI 주요 논문

1. CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding - 다중 모달 대형 언어 모델이 압축된 이미지 형태로 소스 코드를 효과적으로 이해하며, 코드 이해 작업에서 성능을 유지하거나 개선하면서도 토큰 수를 크게 줄일 수 있음을 보여줌. - [자세한 내용 보기](https://arxiv.org/abs/2602.01785)2. daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently - 장기적인 에이전트 작업 흐름에서의 문제를 해결하기 위해 풀 리퀘스트 시퀀스를 활용하여 구조적 감독을 제공하고, 일관성 유지를 위한 점진적 분해 및 버그 수정 역사로부터..

2월 3일 AI 주요 논문

1. FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents - 파일 시스템 기반의 이중 에이전트 프레임워크는 지속적인 저장소를 외부 메모리로 활용하여 대규모 언어 모델 에이전트가 컨텍스트 윈도우 한계를 넘어 연구 작업을 수행할 수 있도록 합니다. - [자세히 보기](https://arxiv.org/abs/2602.01566)2. WildGraphBench: Benchmarking GraphRAG with Wild-Source Corpora - WildGraphBench는 위키피디아의 구조화된 콘텐츠를 사용하여 다양한 문서 유형에 대한 다중 사실 집계 및 요약 기능을 평가합니..

2월 2일 AI 주요 논문

1. ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas - 자동화된 프레임워크로, 도구 보강된 언어 모델을 합성 데이터를 사용해 훈련하여 다단계 의사결정 능력을 향상시킴. - [아카이브 링크](https://arxiv.org/abs/2601.21558)2. THINKSAFE: Self-Generated Safety Alignment for Reasoning Models - 대형 추론 모델의 안전성을 향상시키기 위해 가벼운 거부 유도와 자가 생성 응답에 대한 미세 조정을 통해 성능을 유지하며 계산 비용을 절감함. - [아카이브 링크](https://arxiv.org/abs/2601.23143)3. T..

1월 30일 AI 주요 논문 소식

1. DynamicVLA: A Vision-Language-Action Model for Dynamic Object Manipulation - 동적 객체 조작 문제를 다루기 위한 컴팩트한 비전-언어-행동 모델을 소개합니다. - 새로운 벤치마크를 통해 적시적응이 가능하고 시간적 추론을 지원합니다. [자세히 보기](https://arxiv.org/abs/2601.22153)2. MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods - 대규모 멀티모달 추론 데이터셋 MMFineReason를 소개하여 비전-언어 모델의 성능을 개선합니다. - 하이 퀄리티 추론 주석을 통해 파라미터 효율성을 보여줍니다...

1월 29일 AI 주요 논문

1. Harder Is Better: Boosting Mathematical Reasoning via Difficulty-Aware GRPO and Multi-Aspect Question Reformulation - MathForge는 수학적 추론을 향상시키기 위해 난이도 인식을 기반으로 한 정책 최적화와 다중 측면의 질문 재구성을 결합한 이중 프레임워크를 제공합니다. 기존의 강화 학습 방법에서의 한계를 해결합니다. [자세히 보기](https://arxiv.org/abs/2601.20614) ![MathForge](https://cdn-thumbnails.huggingface.co/social-thumbnails/papers/2601.20614.png)2. Advancing Open-source..

1월 28일 AI 주요 논문 소식

1. AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security - AI 에이전트의 자율 도구 사용과 환경 상호작용으로 인한 안전 및 보안 문제를 다루기 위해 고급 가드레일 프레임워크가 필요합니다. - 리스크 진단 및 투명한 모니터링 기능을 제공합니다. - [자세한 내용 보기](https://arxiv.org/abs/2601.18491)2. AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning - AdaReasoner는 멀티모달 모델이 도구 사용을 일반적인 추론 기술로 학습할 수 있도록 합니다. - 스케일러블 데이터 큐레이션과 도..

1월 2주차 AI 주요 논문 정리

1. GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization - Upvotes: 125 - [논문 보기](https://huggingface.co/papers/2601.05242) - 이 논문은 다중 보상 강화 학습(RL)을 위한 정책 최적화 방법인 GDPO를 제안한다. 각 집단의 보상을 분리하여, 보다 효과적인 학습과 성과 향상을 목표로 한다. 2. NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos - Upvotes: 107 - [논문 보기](https://huggingface.co/pape..

LLM (Large Language Model) 대규모 언어 모델

1. 개요LLM은 대규모 데이터 학습을 통해 인간 언어를 처리, 이해, 생성하는 AI 모델로, Transformer 기반 신경망을 활용하여 다양한 산업에서 활용됨2. LLM의 개념 및 구조 가. 개념LLM 정의: 대규모 데이터셋을 학습하여 인간 언어를 이해하고 생성하는 AI 모델 ​기술 기반: Transformer 신경망 구조를 사용하며, 수억~수십억 개의 파라미터를 포함 ​나. 개념도Transformer 모델의 Encoder와 Decoder 구조. Encoder는 입력 텍스트를 분석하고, Decoder는 이를 바탕으로 출력 텍스트를 생성Self-Attention은 문맥을 고려한 관계 분석을 가능하게 하며, 병렬 처리로 속도를 향상시킴​다. LLM 주요 기능 구분주요 내용텍스트 생성사용자 요청에 맞는 자..