-
Notifications
You must be signed in to change notification settings - Fork 39
Open
Description
Zoom: https://navercorp.zoom.us/j/92208940283
페이스북: https://www.facebook.com/weeklyaiarxivpage
News
- World's Most Trustworthy Companies 2023
- 국뽕이 차오른다: 1000개 기업중 40개 포함. 가전, 식품, 소프트웨어, 1위 달성. (의문의 삼지전자 제외)
- 관련 디지틀조선 김동원 기자님 기사
- TIME 100 AI
- Leaders, Innovators, Shapers, Thinkers 카테고리로
- 한국인은 최예진 교수님 (UW) 포함
- 초거대 AI는 데이터의 영향을 받습니다: 동북공정도 ㅡㅡ-;
ArXiv
- Large Language Models as Optimizers
- 세상 많은 문제는 최적화. 근데 gradient 정의가 안되는 최적화는 어떻게?
- OPRO (Optimization by PROmpt): 자연어로 설명가능한 문제들은 LLM을 optimizer로 써서 해결해 보겠다.
- Optimizer LLM 으로 instruction을 생성하고 Scorer LLM에 prompting 한다. 그렇게 하기 위해 meta-prompt를 도입
- 메타프롬프트에는 meta-instruction, 솔루션-점수 pair, 문제 설명등이 포함되고 솔루션-점수가 계속 추가
- 생성 프롬프트의 위치는 Q_begin, Q_end, A_begin 선택할 수 있는데 모델 상황에 따라
- Linear regression, TSP, GSM8K 와 Big bench-Hard 위한 instruction 생성
- 특이한 프롬프트 instruction 만들어짐
- 솔루션 점수를 오름차순/내림차순, 생성 인스트럭션수, 스코어 단위 등 ablation도 많음






Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels