(모델 요약) Llama 3.2: Revolutionizing edge AI and vision with open, customizable models (blog)

Takeaways 요약

  • vision LLMs 11B, 90B
  • text-only lightweight models (1B and 3B) - edge 나 mobile devices
  • context length: 128K tokens
  • torchtune 으로 finetuning 가능
  • torchchat 으로 local deploy 가능
  • On-device Llama Stack distribution: Pytorch ExecuTorch
  • Single-node distribution: Ollama

기타 내용

  • 수집된 데이터뿐 아니라 학습된 모델의 output 도 학습에 사용함.
  • 90B 은 gpt-4o-mini 보다 낫고, 11B 는 Claude 3 - Haiku 보다 나음.
  • Llama Stack Distribution 의 아키텍쳐도 소개되어있음.