(논문 요약) Leave No Context Behind; Efficient Infinite Context Transformers with Infini-attention

(논문 요약) Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention (Paper)

핵심 내용

컨셉:
- 이전 Key, Value 들을 compressive memory 형태로 유지.
- 현재의 Query 를 통해서 원하는 부분 추출.
- 현재의 Multi-Head-Attention 과 interpolation (head 당 interpolation weight 학습).