開源大型語言模型(LLM)的世界充滿了令人興奮的可能性,並且不斷演變。本課程旨在深入探討開源模型。如果您想了解專有模型與開源模型的比較,請參閱"探索和比較不同的LLM"課程。本課程也會涵蓋微調的主題,但更詳細的解釋可以在"微調LLM"課程中找到。
- 了解開源模型
- 理解使用開源模型的好處
- 探索 Hugging Face 和 Azure AI Studio 上可用的開源模型
開源軟體在技術的發展中扮演了至關重要的角色,涵蓋了各個領域。開源倡議(OSI)定義了10項軟體標準,以將軟體歸類為開源。源代碼必須根據OSI批准的許可證公開共享。
雖然LLM的開發與軟體開發有相似之處,但過程並不完全相同。這引發了社群對於LLM背景下開源定義的許多討論。要使模型符合傳統的開源定義,以下信息應公開:
- 用於訓練模型的數據集。
- 作為訓練一部分的完整模型權重。
- 評估代碼。
- 微調代碼。
- 完整的模型權重和訓練指標。
目前只有少數模型符合這些標準。由Allen人工智慧研究所(AllenAI)創建的OLMo模型就是其中之一。
在本課程中,我們將使用"開源模型"這個術語,因為截至撰寫本文時,它們可能不完全符合上述標準。
高度可定制 - 由於開源模型提供了詳細的訓練信息,研究人員和開發者可以修改模型的內部結構。這使得能夠創建高度專業化的模型,針對特定任務或研究領域進行微調。一些例子包括代碼生成、數學運算和生物學。
成本 - 使用和部署這些模型的每個token成本低於專有模型。在構建生成式人工智慧應用時,應根據您的使用案例考慮性能與價格的平衡。
靈活性 - 使用開源模型可以靈活地使用不同的模型或將它們結合起來。一個例子是HuggingChat Assistants,用戶可以直接在用戶界面中選擇使用的模型:
LLama2由Meta開發,是一個針對基於聊天應用優化的開源模型。這是由於其微調方法,包括大量的對話和人類反饋。通過這種方法,模型能夠生成更符合人類期望的結果,提供更好的用戶體驗。
一些微調版本的Llama例子包括專注於日語的Japanese Llama和增強版的Llama Pro。
Mistral是一個專注於高性能和效率的開源模型。它使用專家混合方法(Mixture-of-Experts),將一組專業模型組合成一個系統,根據輸入選擇特定模型進行使用。這使得計算更加高效,因為模型僅處理它們專業的輸入。
一些微調版本的Mistral例子包括專注於醫學領域的BioMistral和進行數學運算的OpenMath Mistral。
Falcon是由技術創新研究所(TII)創建的LLM。Falcon-40B基於400億個參數進行訓練,已被證明在計算資源較少的情況下表現優於GPT-3。這是由於其使用了FlashAttention算法和多查詢注意力機制,能夠在推理時減少內存需求。由於推理時間減少,Falcon-40B非常適合聊天應用。
一些微調版本的Falcon例子包括基於開源模型構建的助手OpenAssistant和性能高於基礎模型的GPT4ALL。
選擇開源模型並沒有唯一的答案。一個好的起點是使用Azure AI Studio的按任務篩選功能。這將幫助您了解模型已經訓練的任務類型。Hugging Face也維護了一個LLM排行榜,顯示基於某些指標的最佳表現模型。
如果想要比較不同類型的LLM,Artificial Analysis是另一個很好的資源:
如果您正在處理特定的使用案例,尋找專注於相同領域的微調版本可能會更有效。嘗試多個開源模型,看看它們如何根據您和用戶的期望表現,也是另一個好方法。
開源模型最棒的地方在於您可以很快開始使用它們。查看Azure AI Foundry Model Catalog,其中包含我們在此處討論的特定Hugging Face集合。
完成本課程後,請查看我們的生成式人工智慧學習集合,繼續提升您的生成式人工智慧知識!
免責聲明:
本文件已使用 AI 翻譯服務 Co-op Translator 進行翻譯。儘管我們努力確保翻譯的準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。



