Skip to content

Auto Tokenizer vs Model specific Tokenizer 차이점 #11

Answered by nlee-208
zgotter asked this question in Q&A
Discussion options

You must be logged in to vote

저도 그 부분이 궁금해서 관련해서 가볍게 찾아봤는데 그럴듯한 답변은 못 찾겠네요...!

다만 huggingface documentation

AutoClasses are here to do this job for you so that you automatically retrieve the relevant model given the name/path to the pretrained weights/config/vocabulary

라고 나와 있는 부분만 보고 유추했을 때 다양한 모델 활용 시, huggingface directory 만 Auto에 입력해주는 비교적 단순한 작업으로 모델 별 ~Tokenizer, ~Config, ~ModelFor~ 클래스를 불러오는 수고스러움을 덜 수 있다...? 가 가장 큰 장점이 아닐가 싶습니다.

관련 이슈글 에서는Auto* 를 사용함으로 잘못된 checkpoint 혹은 tokenizer 를 사용하는 실수를 방지할 수 있다 하는데 그게 흔히 일어날만한 실수는 아닌 것 같아 그냥 편리성 하나 보고 쓰는듯 합니다...!

Replies: 1 comment

Comment options

You must be logged in to vote
0 replies
Answer selected by zgotter
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Category
Q&A
Labels
None yet
2 participants