(논문 요약) ReTool: Reinforcement Learning for Strategic Tool Use in LLMs (Paper)

핵심 내용

  • rollout 시 코드 실행한 뒤 그 결과를 CoT 에 반영.