(논문 요약) Knowing When to Ask - Bridging Large Language Models and Data (Paper)
핵심 내용
Retrieval Interleaved Generation (RIG) 는 statistic token 을 활용하여 직접 query 함.
- 구현
- instruction-response dataset 으로 finetune
- 자연어 query 를 DB 의 SQL 로 변환은 heuristic 으로 내용 추출
- 통계 변수: embeddings-based semantic search index
- 장소: string-based named entity
- attribute: regex-based heuristics
- 추출된 entity 를 template 에 대입
- template 예시: How many XX in YY?, What are the most significant XX in YY?
- (논문에서 성능은 RAG 가 더 나았음)