오픈 소스 LLM의 세계는 흥미롭고 끊임없이 진화하고 있습니다. 이 수업은 오픈 소스 모델에 대한 심층적인 이해를 제공하는 것을 목표로 합니다. 독점 모델이 오픈 소스 모델과 어떻게 비교되는지에 대한 정보를 찾고 있다면, "다양한 LLM 탐색 및 비교" 수업으로 이동하세요. 이 수업에서는 미세 조정에 대해서도 다루지만, 더 자세한 설명은 "LLM 미세 조정" 수업에서 확인할 수 있습니다.
- 오픈 소스 모델에 대한 이해를 얻기
- 오픈 소스 모델 작업의 이점 이해하기
- Hugging Face와 Azure AI Studio에서 사용 가능한 오픈 모델 탐색하기
오픈 소스 소프트웨어는 다양한 분야에서 기술 발전에 중요한 역할을 해왔습니다. 오픈 소스 이니셔티브(OSI)는 소프트웨어가 오픈 소스로 분류되기 위한 10가지 기준을 정의했습니다. 소스 코드는 OSI가 승인한 라이선스 하에 공개되어야 합니다.
LLM 개발은 소프트웨어 개발과 유사한 요소를 가지고 있지만, 과정이 완전히 동일하지는 않습니다. 이로 인해 LLM 맥락에서 오픈 소스의 정의에 대한 많은 논의가 있었습니다. 전통적인 오픈 소스 정의에 부합하려면 다음 정보가 공개되어야 합니다:
- 모델 학습에 사용된 데이터셋
- 학습의 일부로서의 전체 모델 가중치
- 평가 코드
- 미세 조정 코드
- 전체 모델 가중치 및 학습 지표
현재 이 기준을 충족하는 모델은 몇 개에 불과합니다. Allen Institute for Artificial Intelligence(AllenAI)에서 만든 OLMo 모델이 이 범주에 속합니다.
이 수업에서는 작성 시점에 위 기준을 완전히 충족하지 않을 수 있으므로 앞으로 모델을 "오픈 모델"이라고 부르겠습니다.
높은 맞춤화 가능성 - 오픈 모델은 상세한 학습 정보를 함께 공개하므로, 연구자와 개발자가 모델 내부를 수정할 수 있습니다. 이를 통해 특정 작업이나 연구 분야에 맞게 미세 조정된 매우 전문화된 모델을 만들 수 있습니다. 예를 들어 코드 생성, 수학 연산, 생물학 등이 있습니다.
비용 - 이러한 모델을 사용하고 배포하는 토큰당 비용이 독점 모델보다 낮습니다. 생성 AI 애플리케이션을 구축할 때, 사용 사례에 맞게 성능 대비 가격을 고려하는 것이 중요합니다.
유연성 - 오픈 모델을 사용하면 다양한 모델을 사용하거나 결합하는 데 유연성을 가질 수 있습니다. 예를 들어, HuggingChat Assistants에서는 사용자가 인터페이스에서 직접 사용할 모델을 선택할 수 있습니다:
Meta에서 개발한 Llama2는 채팅 기반 애플리케이션에 최적화된 오픈 모델입니다. 이는 대량의 대화 및 인간 피드백을 포함한 미세 조정 방법 덕분입니다. 이 방법으로 모델은 인간 기대에 더 부합하는 결과를 생성하여 더 나은 사용자 경험을 제공합니다.
Llama의 미세 조정 버전 예로는 일본어에 특화된 Japanese Llama와 기본 모델을 향상시킨 Llama Pro가 있습니다.
Mistral은 높은 성능과 효율성에 중점을 둔 오픈 모델입니다. Mixture-of-Experts 방식을 사용하여 여러 전문 모델을 하나의 시스템으로 결합하고, 입력에 따라 특정 모델을 선택해 사용합니다. 이를 통해 모델이 전문화된 입력만 처리하므로 계산 효율이 높아집니다.
Mistral의 미세 조정 버전 예로는 의료 분야에 집중한 BioMistral과 수학 연산을 수행하는 OpenMath Mistral이 있습니다.
Falcon은 Technology Innovation Institute(TII)에서 만든 LLM입니다. Falcon-40B는 400억 개의 파라미터로 학습되었으며, GPT-3보다 적은 컴퓨팅 자원으로 더 나은 성능을 보입니다. 이는 FlashAttention 알고리즘과 멀티쿼리 어텐션을 사용해 추론 시 메모리 요구량을 줄였기 때문입니다. 추론 시간이 단축되어 Falcon-40B는 채팅 애플리케이션에 적합합니다.
Falcon의 미세 조정 버전 예로는 오픈 모델 기반의 어시스턴트인 OpenAssistant와 기본 모델보다 높은 성능을 제공하는 GPT4ALL이 있습니다.
오픈 모델을 선택하는 데 정답은 없습니다. 시작하기 좋은 방법은 Azure AI Studio의 작업별 필터 기능을 사용하는 것입니다. 이를 통해 모델이 어떤 작업에 대해 학습되었는지 이해할 수 있습니다. Hugging Face는 특정 지표를 기반으로 최고 성능 모델을 보여주는 LLM 리더보드도 유지합니다.
다양한 유형의 LLM을 비교할 때는 Artificial Analysis도 훌륭한 자료입니다:
특정 사용 사례에 집중한다면, 동일 분야에 특화된 미세 조정 버전을 찾는 것이 효과적일 수 있습니다. 여러 오픈 모델을 실험하여 사용자와 자신의 기대에 맞는 성능을 확인하는 것도 좋은 방법입니다.
오픈 모델의 가장 좋은 점은 빠르게 작업을 시작할 수 있다는 것입니다. 여기서 다룬 모델을 포함한 Hugging Face 컬렉션이 있는 Azure AI Foundry 모델 카탈로그를 확인해 보세요.
이 수업을 마친 후에는 Generative AI 학습 컬렉션을 확인하여 생성 AI 지식을 계속 향상시키세요!
면책 조항:
이 문서는 AI 번역 서비스 Co-op Translator를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있으나, 자동 번역에는 오류나 부정확성이 포함될 수 있음을 유의하시기 바랍니다. 원문 문서가 권위 있는 출처로 간주되어야 합니다. 중요한 정보의 경우 전문적인 인간 번역을 권장합니다. 본 번역 사용으로 인한 오해나 잘못된 해석에 대해 당사는 책임을 지지 않습니다.



