STUDY-RECORD INTRODUCTION

个人的学习大模型的学习笔记和资料保存。

学习内容：

Attenion

--_MQA_GQA.ipynb:包含基本多头自注意力（MHA）、多查询注意力（MQA）和分组查询自注意力（GQA）。

--_sliding_Window.ipynb:包含滑窗注意力及和全局注意力一起的混合注意力机制。

参考资料：

https://blog.csdn.net/shizheng_Li/article/details/145809397

RoPE编码

--RoPE.ipynb:包含RoPE编码的实现。

--RoPE_Explanation.ipynb:解释了为什么实现RoPE编码时是按前后各一半来转换的，而不是论文里一对一对配对旋转来实现的。

参考资料：

https://yuanchaofa.com/post/hands-on-rope-position-embedding.

Transformers

Transformers库的基本使用：

--model.ipynb:使用transformers库的model方法。

--pipeline.ipynb:使用transformers库的pipeline方法。

--tokenizer.ipynb:使用transformers库的tokenizer方法。

--classifier_demo.ipynb:使用transformers库实现基础的文本分类训练推理过程。

--Dataset.ipynb:使用Datasets库方法。

--load_cmrc2018.py：读取cmrc2018数据集的实现。Datasets库新版本不支持scripts,所以在该文件中尝试from_list导入。

--Evaluate.py:使用evaluate库的方式。

--Trainer.py: 使用transformers.Trainer训练之前的demo 参考资料或使用的数据集：

https://www.bilibili.com/video/BV18T411t7h6
https://github.com/SophonPlus/ChineseNlpCorpus
https://huggingface.co/docs/transformers/main/en/index
https://huggingface.co/datasets/madao33/new-title-chinese
cmrc2018数据集是从第一个B站UP主github下载我也没找到原始地点
https://huggingface.co/docs/transformers/trainer

Transformers_NLP

基于Transformers的NLP实现示例：

--Transformers显存优化.ipynb:优化显存的4种方式。

--命名实体识别任务.ipynb: 实现NER任务

--机器阅读理解.ipynb: 用截断处理实现阅读理解任务

--机器阅读理解的滑动窗口实现.ipynb: 用滑动窗口实现阅读理解任务

--多项选择任务.ipynb: 实现多项选择任务

--文本相似度.ipynb: 基于交互策略实现文本相似度任务

--基于向量匹配的文本相似度.ipynb: 基于向量匹配实现文本相似度任务

--检索对话机器人.ipynb: 实现检索对话机器人（基于向量匹配）

参考资料或使用的数据集：

MOE

MOE -> Sparse MOE -> ShareSparse MOE原理和实现; 已经负载均衡损失函数的原理和实现
--MOE_model.ipynb: MOE原理和实现
--MOE学习笔记.md ：AI生成
--auxiliary_loss.py : 负载均衡损失函数的实现和逐步参数调试
--MOE负载均衡损失学习笔记.md ：AI生成

参考资料：

Name		Name	Last commit message	Last commit date
Latest commit History 46 Commits
Attention		Attention
MOE		MOE
RoPE编码		RoPE编码
Transformers		Transformers
Transformers_NLP		Transformers_NLP
dataset		dataset
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

STUDY-RECORD INTRODUCTION

Attenion

RoPE编码

Transformers

Transformers_NLP

MOE

About

Uh oh!

Releases

Packages

Languages

License

JinfanShen/Shen-LLM-STUDY-RECORD

Folders and files

Latest commit

History

Repository files navigation

STUDY-RECORD INTRODUCTION

Attenion

RoPE编码

Transformers

Transformers_NLP

MOE

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages