(논문 요약) HOW TO TEACH LARGE MULTIMODAL MODELS NEW SKILLS? (Paper)

핵심 내용

  • Self-Attention Projection layer 학습시 catastrophic forgetting 이 가장 적었음.
    • Self-Attention Projection, MLP 를 떼어서 부분적으로 실험하면서 성능 측정.
  • 실험한 모델: LLaVA-NeXT (LLaMA-3 8B), Qwen2.5-VL (7B)