(논문 요약) SimPO; Simple Preference Optimization with a Reference-Free Reward

(논문 요약) SimPO: Simple Preference Optimization with a Reference-Free Reward (paper)

핵심 내용