@@ -19,21 +19,23 @@ Kiwi가 다른 형태소 분석기에 비해 압도적으로 높은 정확도를
1919
2020## 직접 평가 실행해보기
2121다른 형태소 분석기를 테스트하기 위해서는 konlpy가 필요합니다.
22- 특히 Mecab을 이용시 split_inflect 기능 패치가 추가된 [ konlpy 버전] ( https://github.com/konlpy/konlpy/commit/d9206305195583c08400cb2237c837cc42df2e65 ) 이 필요합니다.
22+ 특히 Mecab 이용시 split_inflect 기능 패치가 추가된 [ konlpy 버전] ( https://github.com/konlpy/konlpy/commit/d9206305195583c08400cb2237c837cc42df2e65 ) 이 필요합니다.
2323
2424``` console
25- $ python disambiguate.py testset/* .txt --target=kiwi,komoran,mecab,kkma,hannanum,okt --error_output_dir=errors/
26- Initialize kiwipiepy (0.11.0)
25+ $ python disambiguate.py testset/* .txt --target=kiwi,kiwi_sbg,komoran,mecab,kkma,hannanum,okt --error_output_dir=errors/
26+ Initialize kiwipiepy (0.17.1)
27+ Initialize kiwipiepy (0.17.1)
2728Initialize Komoran from konlpy (0.6.0)
2829Initialize Mecab from konlpy (0.6.0)
2930Initialize Kkma from konlpy (0.6.0)
3031Initialize Hannanum from konlpy (0.6.0)
3132Initialize Okt from konlpy (0.6.0)
32- kiwi komoran mecab kkma hannanum okt
33- irregular_verbs.txt 0.776 0.463 0.463 0.522 0.463 0.463
34- verb_vs_adj.txt 0.907 0.407 0.537 0.463 - -
35- nouns.txt 0.891 0.545 0.600 0.709 0.473 0.527
36- distant.txt 0.613 0.419 0.548 0.419 - -
33+ Initialize khaiii (0.4)
34+ kiwi kiwi_sbg komoran mecab kkma hannanum okt khaiii
35+ distant.txt 0.581 0.774 0.419 0.548 0.419 - - 0.484
36+ irregular_verbs.txt 0.821 0.896 0.463 0.463 0.522 0.463 0.463 0.552
37+ nouns.txt 0.891 0.891 0.545 0.600 0.709 0.473 0.527 0.673
38+ verb_vs_adj.txt 0.907 0.907 0.407 0.537 0.463 - - 0.611
3739```
3840
39- ` Hannanum ` 과 ` Okt ` 의 경우 동사와 형용사를 별도로 구분하는 기능이 없어서 ` verb_vs_adj ` 이나 ` distant ` 평가에서 점수를 매기지 않습니다.
41+ ` Hannanum ` 과 ` Okt ` 의 경우 동사와 형용사를 별도로 구분하는 기능이 없어서 ` verb_vs_adj ` 이나 ` distant ` 평가에서 점수를 매기지 않습니다.
0 commit comments