Skip to content

有一个理解上的歧义点,对位置编码的表述容易产生歧义。#147

Open
jackyzzy wants to merge 2 commits intodatawhalechina:mainfrom
jackyzzy:main
Open

有一个理解上的歧义点,对位置编码的表述容易产生歧义。#147
jackyzzy wants to merge 2 commits intodatawhalechina:mainfrom
jackyzzy:main

Conversation

@jackyzzy
Copy link
Contributor

绝对位置编码和相对位置编码的理解容易产生歧义。
BERT用的Embedding是绝对位置编码,加上偏置之后也并不是相对位置编码。相对外置编码,如,RoPE,能够突破最大长度的限制,而绝对位置编码不行。

@KMnO4-zx
Copy link
Contributor

感谢补充!但这段修改有几个问题需要调整后才能合并:

  1. 这是只是加了部分偏置 有语法错误,请修正
  2. Sinusoidal 位置编码理论上可以外推到训练长度之外,说"完全无法处理"不够准确
  3. 这段内容和下方的"注"高度重复,建议考虑合并到"注"里,或者删除其中一处,避免冗余
  4. 括号内不适合放这么长的技术讨论,建议改为独立的一句话或脚注形式

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants