1. Harder Is Better: Boosting Mathematical Reasoning via Difficulty-Aware GRPO and Multi-Aspect Question Reformulation - MathForge는 수학적 추론을 향상시키기 위해 난이도 인식을 기반으로 한 정책 최적화와 다중 측면의 질문 재구성을 결합한 이중 프레임워크를 제공합니다. 기존의 강화 학습 방법에서의 한계를 해결합니다. [자세히 보기](https://arxiv.org/abs/2601.20614) 2. Advancing Open-source..