-
Notifications
You must be signed in to change notification settings - Fork 39
Open
Description
News
- Conferences
- CVPR 2023
- 일시/장소: 6. 18 - 22, Vancouver convention center
- Main and Expo: 20 - 22, Workshop and Tutorial: 18-19
- 국내 부스: LG, 현대차 등 (네이버 논문 8개 포스터 방문 많이 해주세요)
- EMNLP 2023
- Abs & Full: 16일, 23일 (AoE)
- EU AI 법안과 CRFM의 LLM 조건 만족도 평가


- CVPR 2023
ArXiv
-
InstructZero: Efficient Instruction Optimization for Black-Box Large Language Models
- U of Maryland 에서 나온 Open-source small LLM과 Big tech black box LLM을 함께 활용하는 방법
- sLLM은 soft prompt (보통 벡터형태) 와 사용자 입력을 black box LLM에 입력하기 위한 instruct로 변환
- 변환된 instruct + 사용자 예시가 black box LLM으로 들어가면 결과와 스코어 기반으로 bayesian optimization 해서 다시 soft prompt 업데이트
- 코드는 여기: https://github.com/Lichang-Chen/InstructZero
- 프로젝트 페이지는 여기: https://lichang-chen.github.io/InstructZero/




-
Knowledge Distillation of Large Language Models
- CoAI group, 칭화대, MSR 에서 나온 연구
- Reverse KLD를 활용한 Whitebox 시나리오 기반의 LLM --> sLLM, 기존 Foward KLD 기반 KD보다 안정적
- Foward KLD가 teacher가 뱉는 걸 student가 외운다 느낌이면 Reverse KLD KD는 student가 더 잘 생성하도록 teacher를 통해 가이드한다 느낌.
- 코드는 https://github.com/microsoft/LMOps/tree/main/minillm


Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels