- 01_main-chapter-code 包含主要章节代码和习题解答
- 02_dataset-utilities 包含用于准备指令数据集的实用代码
- 03_model-evaluation 包含用于使用本地 Llama 3 模型和 GPT-4 API 评估指令响应的实用代码
- 04_preference-tuning-with-dpo 实现了使用直接偏好优化(DPO)进行偏好微调的代码
- 05_dataset-generation 包含用于生成和改进指令微调的合成数据集的代码
- 06_user_interface 实现了一个互动用户界面,用于与预训练的 LLM 进行交互