个人的学习大模型的学习笔记和资料保存。
学习内容:
--_MQA_GQA.ipynb:包含基本多头自注意力(MHA)、多查询注意力(MQA)和分组查询自注意力(GQA)。
--_sliding_Window.ipynb:包含滑窗注意力及和全局注意力一起的混合注意力机制。
参考资料:
--RoPE.ipynb:包含RoPE编码的实现。
--RoPE_Explanation.ipynb:解释了为什么实现RoPE编码时是按前后各一半来转换的,而不是论文里一对一对配对旋转来实现的。
参考资料:
Transformers库的基本使用:
--model.ipynb:使用transformers库的model方法。
--pipeline.ipynb:使用transformers库的pipeline方法。
--tokenizer.ipynb:使用transformers库的tokenizer方法。
--classifier_demo.ipynb:使用transformers库实现基础的文本分类训练推理过程。
--Dataset.ipynb:使用Datasets库方法。
--load_cmrc2018.py:读取cmrc2018数据集的实现。Datasets库新版本不支持scripts,所以在该文件中尝试from_list导入。
--Evaluate.py:使用evaluate库的方式。
--Trainer.py: 使用transformers.Trainer训练之前的demo 参考资料或使用的数据集:
- https://www.bilibili.com/video/BV18T411t7h6
- https://github.com/SophonPlus/ChineseNlpCorpus
- https://huggingface.co/docs/transformers/main/en/index
- https://huggingface.co/datasets/madao33/new-title-chinese
- cmrc2018数据集是从第一个B站UP主github下载 我也没找到原始地点
- https://huggingface.co/docs/transformers/trainer
基于Transformers的NLP实现示例:
--Transformers显存优化.ipynb:优化显存的4种方式。
--命名实体识别任务.ipynb: 实现NER任务
--机器阅读理解.ipynb: 用截断处理实现阅读理解任务
--机器阅读理解的滑动窗口实现.ipynb: 用滑动窗口实现阅读理解任务
--多项选择任务.ipynb: 实现多项选择任务
--文本相似度.ipynb: 基于交互策略实现文本相似度任务
--基于向量匹配的文本相似度.ipynb: 基于向量匹配实现文本相似度任务
--检索对话机器人.ipynb: 实现检索对话机器人(基于向量匹配)
参考资料或使用的数据集:
- https://www.bilibili.com/video/BV18T411t7h6
- https://github.com/CLUEbenchmark/SimCLUE/tree/main?tab=readme-ov-file
- https://github.com/SophonPlus/ChineseNlpCorpus?tab=readme-ov-file
MOE -> Sparse MOE -> ShareSparse MOE原理和实现; 已经负载均衡损失函数的原理和实现
--MOE_model.ipynb: MOE原理和实现
--MOE学习笔记.md :AI生成
--auxiliary_loss.py : 负载均衡损失函数的实现和逐步参数调试
--MOE负载均衡损失学习笔记.md :AI生成
参考资料: