Skip to content

[20230924] Weekly AI ArXiv 만담 시즌2 - 27회차 #93

@jungwoo-ha

Description

@jungwoo-ha

Zoom 웨비나 주소: https://navercorp.zoom.us/j/92208940283

News

ArXiv

  • LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models
    • CHUK 와 MIT (Song Han) 협업 연구
    • Shift short attention 과 LoRA를 합해서 PEFT 형태로 long-context FT를 진행
    • Short attention은 전체 context leangth의 1/4만.. 이걸 shift로 커버
    • LoRA 외에 embedding 과 Norm을 추가 학습 하는 셋업을 LoRA+ 라고 --> 요건 context 길 때 유효
    • 주로 실험은 LLaMA 7B, 13B, 70B (8 A100 1대로 모든 실험)
    • 일단 숫자는 경쟁력 있어보이긴 한데 얼마나 워킹할지는 테스트 필요

image
image
image

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions