• Turing Post Korea
  • Posts
  • '수학적 추론'의 발전을 보여주는 논문 10選

'수학적 추론'의 발전을 보여주는 논문 10選

작년 말부터 지금까지, AI 모델들의 수학적인 추론 능력이 급격히 향상되는 모습을 확인할 수 있는데요. 마이크로소프트, 엔비디아, 알리바바 같은 주요 기업들이 모델을 수학적으로 ‘더 똑똑하게’, ‘더 문제를 잘 풀게’ 만들기 위한 경쟁을 계속하고 있기 때문이죠. 지금 일어나고 있는 이런 발전은 어떤 의미가 있을까요?

복잡한 수학적 계산을 해 내려면, 고도의 다단계 추론을 할 수 있어야 하니까, ‘수학’이라는 영역 자체가 모델의 강력한 ‘사고’ 능력을 보여주기 위해서 아주 이상적인 분야가 됩니다. 또 AI가 계속 발전하고 머신러닝이나 양자 컴퓨팅 - 2025년에 크게 발전하지 않을까 싶은데요 - 과 같은 수학 집약적인 분야에 적용되면서, 복잡한 추론 능력이 반드시 필요하게 된 상황도 한 몫 했다 싶구요. 더불어, AI 모델들은 대규모의 수학 문제를 해결하기 위해서 ‘Symbolic Solver’라든가 ‘연산 엔진’ 같은 외부 도구들을 통합해야 할 때도 있는데, 이 때도 마찬가지로 꽤 높은 수준의 수학적 추론 능력이 필요하겠죠.

여기에 최근 ‘수학적 추론’ 영역의 큰 발전과 관련된 10개의 논문을 모아 봤습니다:

1. AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling (2412.15084) - 엔비디아

2. The Lessons of Developing Process Reward Models in Mathematical Reasoning (2501.07301) - Qwen, 알리바바

3. rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking (2501.04519) - 마이크로소프트 리서치

4. BoostStep: Boosting mathematical capability of Large Language Models via improved single-step reasoning (2501.03226) - 상하이 AI 연구소, 상하이 교통대학교

5. URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics (2501.04686) - ByteDance, 칭화대학교

6. U-MATH: A University-Level Benchmark for Evaluating Mathematical Skills in LLMs (2412.03205) - Toloka AI, Gradarius

7. Open Eyes, Then Reason: Fine-grained Visual Mathematical Understanding in MLLMs (2501.06430) - 호주 머신러닝 연구소, 아들레이드대학교, 조지아텍

8. End-to-End Bangla AI for Solving Math Olympiad Problem Benchmark: Leveraging Large Language Model Using Integrated Approach (2501.04425) - 방글라데시대학교

9. Quantization Meets Reasoning: Exploring LLM Low-Bit Quantization Degradation for Mathematical Reasoning (2501.03035) - 홍콩 폴리테크닉 대학교, 칭화대학교

10. System-2 Mathematical Reasoning via Enriched Instruction Tuning (2412.16964) - 텐센트, 시드니공과대학교

*읽어주셔서 감사합니다. 재미있게 보셨다면 친구와 동료 분들에게도 뉴스레터를 추천해 주세요.

Reply

or to participate.