generative-ai-for-beginners/translations/zh/16-open-source-models/README.md at main · pavz02/generative-ai-for-beginners

介绍

开源LLM的世界充满了激动人心的变化，并且不断发展。本课程旨在深入了解开源模型。如果您想了解专有模型与开源模型的比较，请参阅"探索和比较不同的LLM"课程。本课程还将涉及微调的主题，但更详细的解释可以在"微调LLM"课程中找到。

学习目标

了解开源模型
理解使用开源模型的好处
探索Hugging Face和Azure AI Studio上的开源模型

什么是开源模型？

开源软件在各个领域的技术发展中发挥了至关重要的作用。开源倡议（OSI）定义了软件被归类为开源的10个标准。源代码必须在OSI批准的许可证下公开共享。

虽然LLM的开发与软件开发有相似之处，但过程并不完全相同。这引发了社区关于LLM背景下开源定义的广泛讨论。要使模型符合传统的开源定义，以下信息应公开可用：

用于训练模型的数据集。
作为训练一部分的完整模型权重。
评估代码。
微调代码。
完整的模型权重和训练指标。

目前只有少数模型符合这些标准。由Allen人工智能研究所（AllenAI）创建的OLMo模型就是其中之一。

在本课程中，我们将这些模型称为“开源模型”，因为在撰写本文时，它们可能不完全符合上述标准。

开源模型的优势

高度可定制 - 由于开源模型发布时附带了详细的训练信息，研究人员和开发人员可以修改模型的内部结构。这使得创建针对特定任务或研究领域高度专业化的模型成为可能。例如代码生成、数学运算和生物学等领域。

成本 - 使用和部署这些模型的每个token成本低于专有模型。在构建生成式AI应用时，应根据您的使用场景权衡性能与价格。

来源：Artificial Analysis

灵活性 - 使用开源模型可以灵活地使用不同的模型或将它们结合起来。例如在HuggingChat Assistants中，用户可以直接在用户界面中选择所使用的模型：

探索不同的开源模型

Llama 2

LLama2由Meta开发，是一个针对基于聊天应用优化的开源模型。这是由于其微调方法包含了大量的对话和人类反馈。通过这种方法，模型生成的结果更符合人类期望，从而提供更好的用户体验。

一些Llama的微调版本包括专注于日语的Japanese Llama和增强版的Llama Pro。

Mistral

Mistral是一个专注于高性能和高效率的开源模型。它采用了专家混合（Mixture-of-Experts）方法，将一组专门的专家模型组合成一个系统，根据输入选择特定的模型使用。这使得计算更加高效，因为模型只处理它们擅长的输入。

一些Mistral的微调版本包括专注于医疗领域的BioMistral和执行数学计算的OpenMath Mistral。

Falcon

Falcon是由技术创新研究所（TII）创建的LLM。Falcon-40B在400亿参数上进行了训练，已被证明在计算预算较少的情况下表现优于GPT-3。这得益于其使用的FlashAttention算法和多查询注意力机制，使其在推理时减少了内存需求。由于推理时间减少，Falcon-40B适用于聊天应用。

一些Falcon的微调版本包括基于开源模型构建的OpenAssistant和性能优于基础模型的GPT4ALL。

如何选择

选择开源模型没有唯一的答案。一个好的起点是使用Azure AI Studio的按任务筛选功能。这将帮助您了解模型已被训练用于哪些类型的任务。Hugging Face还维护了一个LLM排行榜，显示基于某些指标的最佳表现模型。

在比较不同类型的LLM时，Artificial Analysis是另一个很好的资源：

来源：Artificial Analysis

如果针对特定用例工作，寻找专注于相同领域的微调版本可能会更有效。尝试多个开源模型，看看它们如何根据您和用户的期望表现，也是一个不错的做法。

下一步

开源模型的最佳部分是您可以很快开始使用它们。查看Azure AI Foundry模型目录，其中包含我们在此讨论的模型的特定Hugging Face集合。

学习不会止步于此，继续探索之旅

完成本课程后，请查看我们的生成式AI学习集合，继续提升您的生成式AI知识！

免责声明：
本文档使用AI翻译服务Co-op Translator进行翻译。尽管我们努力确保翻译的准确性，但请注意，自动翻译可能包含错误或不准确之处。应以原始语言的文档作为权威来源。对于重要信息，建议使用专业人工翻译。我们对因使用此翻译而产生的任何误解或误读不承担责任。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

介绍

学习目标

什么是开源模型？

开源模型的优势

探索不同的开源模型

Llama 2

Mistral

Falcon

如何选择

下一步

学习不会止步于此，继续探索之旅

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

介绍

学习目标

什么是开源模型？

开源模型的优势

探索不同的开源模型

Llama 2

Mistral

Falcon

如何选择

下一步

学习不会止步于此，继续探索之旅