generative-ai-for-beginners/translations/tw/16-open-source-models/README.md at main · KiZach/generative-ai-for-beginners

介紹

開源大型語言模型（LLM）的世界充滿了令人興奮的可能性，並且不斷演變。本課程旨在深入探討開源模型。如果您想了解專有模型與開源模型的比較，請參閱"探索和比較不同的LLM"課程。本課程也會涵蓋微調的主題，但更詳細的解釋可以在"微調LLM"課程中找到。

學習目標

了解開源模型
理解使用開源模型的好處
探索 Hugging Face 和 Azure AI Studio 上可用的開源模型

什麼是開源模型？

開源軟體在技術的發展中扮演了至關重要的角色，涵蓋了各個領域。開源倡議（OSI）定義了10項軟體標準，以將軟體歸類為開源。源代碼必須根據OSI批准的許可證公開共享。

雖然LLM的開發與軟體開發有相似之處，但過程並不完全相同。這引發了社群對於LLM背景下開源定義的許多討論。要使模型符合傳統的開源定義，以下信息應公開：

用於訓練模型的數據集。
作為訓練一部分的完整模型權重。
評估代碼。
微調代碼。
完整的模型權重和訓練指標。

目前只有少數模型符合這些標準。由Allen人工智慧研究所（AllenAI）創建的OLMo模型就是其中之一。

在本課程中，我們將使用"開源模型"這個術語，因為截至撰寫本文時，它們可能不完全符合上述標準。

開源模型的好處

高度可定制 - 由於開源模型提供了詳細的訓練信息，研究人員和開發者可以修改模型的內部結構。這使得能夠創建高度專業化的模型，針對特定任務或研究領域進行微調。一些例子包括代碼生成、數學運算和生物學。

成本 - 使用和部署這些模型的每個token成本低於專有模型。在構建生成式人工智慧應用時，應根據您的使用案例考慮性能與價格的平衡。

來源：Artificial Analysis

靈活性 - 使用開源模型可以靈活地使用不同的模型或將它們結合起來。一個例子是HuggingChat Assistants，用戶可以直接在用戶界面中選擇使用的模型：

探索不同的開源模型

Llama 2

LLama2由Meta開發，是一個針對基於聊天應用優化的開源模型。這是由於其微調方法，包括大量的對話和人類反饋。通過這種方法，模型能夠生成更符合人類期望的結果，提供更好的用戶體驗。

一些微調版本的Llama例子包括專注於日語的Japanese Llama和增強版的Llama Pro。

Mistral

Mistral是一個專注於高性能和效率的開源模型。它使用專家混合方法（Mixture-of-Experts），將一組專業模型組合成一個系統，根據輸入選擇特定模型進行使用。這使得計算更加高效，因為模型僅處理它們專業的輸入。

一些微調版本的Mistral例子包括專注於醫學領域的BioMistral和進行數學運算的OpenMath Mistral。

Falcon

Falcon是由技術創新研究所（TII）創建的LLM。Falcon-40B基於400億個參數進行訓練，已被證明在計算資源較少的情況下表現優於GPT-3。這是由於其使用了FlashAttention算法和多查詢注意力機制，能夠在推理時減少內存需求。由於推理時間減少，Falcon-40B非常適合聊天應用。

一些微調版本的Falcon例子包括基於開源模型構建的助手OpenAssistant和性能高於基礎模型的GPT4ALL。

如何選擇

選擇開源模型並沒有唯一的答案。一個好的起點是使用Azure AI Studio的按任務篩選功能。這將幫助您了解模型已經訓練的任務類型。Hugging Face也維護了一個LLM排行榜，顯示基於某些指標的最佳表現模型。

如果想要比較不同類型的LLM，Artificial Analysis是另一個很好的資源：

來源：Artificial Analysis

如果您正在處理特定的使用案例，尋找專注於相同領域的微調版本可能會更有效。嘗試多個開源模型，看看它們如何根據您和用戶的期望表現，也是另一個好方法。

下一步

開源模型最棒的地方在於您可以很快開始使用它們。查看Azure AI Foundry Model Catalog，其中包含我們在此處討論的特定Hugging Face集合。

學習不止於此，繼續您的旅程

完成本課程後，請查看我們的生成式人工智慧學習集合，繼續提升您的生成式人工智慧知識！

免責聲明：
本文件已使用 AI 翻譯服務 Co-op Translator 進行翻譯。儘管我們努力確保翻譯的準確性，但請注意，自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息，建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

介紹

學習目標

什麼是開源模型？

開源模型的好處

探索不同的開源模型

Llama 2

Mistral

Falcon

如何選擇

下一步

學習不止於此，繼續您的旅程

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

介紹

學習目標

什麼是開源模型？

開源模型的好處

探索不同的開源模型

Llama 2

Mistral

Falcon

如何選擇

下一步

學習不止於此，繼續您的旅程