2024년도 한국통신학회 동계종합학술발표회
[Korean dialect-standard language translation using special token in KoBART ]
논문 링크 : https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11737538
논문 드라이브 : https://drive.google.com/file/d/1S3Cxmu3qrOvO8ddgY0Xai4QPb1LnO30a/view?usp=sharing
아이디어 경진대회 : https://drive.google.com/file/d/1gAMhgM3TRh5d3LVB3KIytlXItcHtwsHk/view
Standard & Dialect 병렬 데이터셋을 이용하여 트랜스포머모델인 KoBart모델을 FineTuning 하여 번역을 더 잘 해보고자 하는 프로젝트입니다.
허깅페이스 API중 Trainer 클래스를 이용하여 학습, 평가 하였습니다.
데이터셋은 AI허브 사이트에서 다운로드하였습니다.