-
Notifications
You must be signed in to change notification settings - Fork 39
Open
Description
News
- HyperCLOVA X 공개 (8.24)
- 네이버클라우드 소개페이지: https://www.ncloud.com/solution/featured/hyperclovax
- DAN23 영상 다시보기: https://tv.naver.com/v/39568301
- ChatGPT-3.5 Tuning and Enterprise
- Google Cloud Next 2023
- TPUv5e
- 듀엣AI, Vertex AI -- LLM은 B2B로
- 메타, 유럽서 페북·인스타 ‘유료버전’ 검토…EU 규제 영향
ArXiv
-
DoReMi: Optimizing Data Mixtures Speeds Up Language Model Pretraining
-
The Belebele Benchmark: a Parallel Reading Comprehension Dataset in 122 Language Variants
- Meta에서 만든 122개 언어를 커버하는 Multi-choice MRC 데이터셋
- 기반은 다국어 번역 벤치마크인 FLORES-200의 passage들을 기반으로 함
- 이를 Human - AI collaboration 을 통해 MRC 셋으로 만들어 공개
- 언어종류도 High, mid, low resource 즉 주류 중간 비주류 언어 모두를 커버하도록
- 평가는 MLM 모델 (InfoXLM, XLM-V, 번역후 학습), LLM (GPT-3.5-Turbo, LLaMA1,2, Falcon-40B, Zero-shot)
- Low resource 언어는 모델 커져도 별로 재미를 못보는 듯..




Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels



