Skip to content

Latest commit

 

History

History
93 lines (56 loc) · 6.85 KB

File metadata and controls

93 lines (56 loc) · 6.85 KB

開源模型

介紹

開源大型語言模型(LLM)的世界充滿了令人興奮的可能性,並且不斷演變。本課程旨在深入探討開源模型。如果您想了解專有模型與開源模型的比較,請參閱"探索和比較不同的LLM"課程。本課程也會涵蓋微調的主題,但更詳細的解釋可以在"微調LLM"課程中找到。

學習目標

  • 了解開源模型
  • 理解使用開源模型的好處
  • 探索 Hugging Face 和 Azure AI Studio 上可用的開源模型

什麼是開源模型?

開源軟體在技術的發展中扮演了至關重要的角色,涵蓋了各個領域。開源倡議(OSI)定義了10項軟體標準,以將軟體歸類為開源。源代碼必須根據OSI批准的許可證公開共享。

雖然LLM的開發與軟體開發有相似之處,但過程並不完全相同。這引發了社群對於LLM背景下開源定義的許多討論。要使模型符合傳統的開源定義,以下信息應公開:

  • 用於訓練模型的數據集。
  • 作為訓練一部分的完整模型權重。
  • 評估代碼。
  • 微調代碼。
  • 完整的模型權重和訓練指標。

目前只有少數模型符合這些標準。由Allen人工智慧研究所(AllenAI)創建的OLMo模型就是其中之一。

在本課程中,我們將使用"開源模型"這個術語,因為截至撰寫本文時,它們可能不完全符合上述標準。

開源模型的好處

高度可定制 - 由於開源模型提供了詳細的訓練信息,研究人員和開發者可以修改模型的內部結構。這使得能夠創建高度專業化的模型,針對特定任務或研究領域進行微調。一些例子包括代碼生成、數學運算和生物學。

成本 - 使用和部署這些模型的每個token成本低於專有模型。在構建生成式人工智慧應用時,應根據您的使用案例考慮性能與價格的平衡。

模型成本
來源:Artificial Analysis

靈活性 - 使用開源模型可以靈活地使用不同的模型或將它們結合起來。一個例子是HuggingChat Assistants,用戶可以直接在用戶界面中選擇使用的模型:

選擇模型

探索不同的開源模型

Llama 2

LLama2由Meta開發,是一個針對基於聊天應用優化的開源模型。這是由於其微調方法,包括大量的對話和人類反饋。通過這種方法,模型能夠生成更符合人類期望的結果,提供更好的用戶體驗。

一些微調版本的Llama例子包括專注於日語的Japanese Llama和增強版的Llama Pro

Mistral

Mistral是一個專注於高性能和效率的開源模型。它使用專家混合方法(Mixture-of-Experts),將一組專業模型組合成一個系統,根據輸入選擇特定模型進行使用。這使得計算更加高效,因為模型僅處理它們專業的輸入。

一些微調版本的Mistral例子包括專注於醫學領域的BioMistral和進行數學運算的OpenMath Mistral

Falcon

Falcon是由技術創新研究所(TII)創建的LLM。Falcon-40B基於400億個參數進行訓練,已被證明在計算資源較少的情況下表現優於GPT-3。這是由於其使用了FlashAttention算法和多查詢注意力機制,能夠在推理時減少內存需求。由於推理時間減少,Falcon-40B非常適合聊天應用。

一些微調版本的Falcon例子包括基於開源模型構建的助手OpenAssistant和性能高於基礎模型的GPT4ALL

如何選擇

選擇開源模型並沒有唯一的答案。一個好的起點是使用Azure AI Studio的按任務篩選功能。這將幫助您了解模型已經訓練的任務類型。Hugging Face也維護了一個LLM排行榜,顯示基於某些指標的最佳表現模型。

如果想要比較不同類型的LLM,Artificial Analysis是另一個很好的資源:

模型質量
來源:Artificial Analysis

如果您正在處理特定的使用案例,尋找專注於相同領域的微調版本可能會更有效。嘗試多個開源模型,看看它們如何根據您和用戶的期望表現,也是另一個好方法。

下一步

開源模型最棒的地方在於您可以很快開始使用它們。查看Azure AI Foundry Model Catalog,其中包含我們在此處討論的特定Hugging Face集合。

學習不止於此,繼續您的旅程

完成本課程後,請查看我們的生成式人工智慧學習集合,繼續提升您的生成式人工智慧知識!


免責聲明
本文件已使用 AI 翻譯服務 Co-op Translator 進行翻譯。儘管我們努力確保翻譯的準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。