(논문 요약) Knowing When to Ask - Bridging Large Language Models and Data | Jaemin’s Arxiv

(논문 요약) Knowing When to Ask - Bridging Large Language Models and Data (Paper)

핵심 내용

Retrieval Interleaved Generation (RIG) 는 statistic token 을 활용하여 직접 query 함.
구현
- instruction-response dataset 으로 finetune
- 자연어 query 를 DB 의 SQL 로 변환은 heuristic 으로 내용 추출
  - 통계 변수: embeddings-based semantic search index
  - 장소: string-based named entity
  - attribute: regex-based heuristics
- 추출된 entity 를 template 에 대입
  - template 예시: How many XX in YY?, What are the most significant XX in YY?
(논문에서 성능은 RAG 가 더 나았음)