(논문 요약) Show, Don’t Tell: Aligning Language Models with Demonstrated Feedback (Paper)
핵심 내용
User 가 결과 수정시, 중간 단계 데이터들을 학습에 활용

결과: win-rate 평가

(논문 요약) Show, Don’t Tell: Aligning Language Models with Demonstrated Feedback (Paper)
User 가 결과 수정시, 중간 단계 데이터들을 학습에 활용

결과: win-rate 평가
