(논문 요약) DEMYSTIFYING EMBEDDING SPACES USING LARGE LANGUAGE MODELS (Paper)

핵심 내용

  • 목표: LLM 으로 embedding 의 의미를 자연어로 추출.
  • 방법:
    • 주어진 것: (1) word -> domain embedding space 로 변환하는 모델 (2) LLM
    • domain-embedding-vector -> LLM-embedding-vector 의 mapping 을 학습.
    • 학습 데이터 생성: LLM 으로 (input, output) 쌍을 모은 뒤, ELM 의 학습 데이터로 사용