Skip to content

Commit 3f24604

Browse files
committed
Merge branch 'main' of https://github.com/bab2min/kiwipiepy
2 parents aad1735 + b59e30d commit 3f24604

1 file changed

Lines changed: 12 additions & 10 deletions

File tree

benchmark/disambiguate/README.md

Lines changed: 12 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -18,22 +18,24 @@
1818
Kiwi가 다른 형태소 분석기에 비해 압도적으로 높은 정확도를 보임을 확인할 수 있습니다.
1919

2020
## 직접 평가 실행해보기
21-
다른 형태소 분석기를 테스트하기 위해서는 konlpy가 필요합니다.
22-
특히 Mecab을 이용시 split_inflect 기능 패치가 추가된 [konlpy 버전](https://github.com/konlpy/konlpy/commit/d9206305195583c08400cb2237c837cc42df2e65)이 필요합니다.
21+
다른 형태소 분석기를 테스트하기 위해서는 konlpy 혹은 khaiii를 설치해야합니다.
22+
특히 Mecab 이용시 split_inflect 기능 패치가 추가된 [konlpy 버전](https://github.com/konlpy/konlpy/commit/d9206305195583c08400cb2237c837cc42df2e65)이 필요합니다.
2323

2424
```console
25-
$ python disambiguate.py testset/*.txt --target=kiwi,komoran,mecab,kkma,hannanum,okt --error_output_dir=errors/
26-
Initialize kiwipiepy (0.11.0)
25+
$ python disambiguate.py testset/*.txt --target=kiwi,kiwi_sbg,komoran,mecab,kkma,hannanum,okt,khaiii --error_output_dir=errors/
26+
Initialize kiwipiepy (0.17.1)
27+
Initialize kiwipiepy (0.17.1)
2728
Initialize Komoran from konlpy (0.6.0)
2829
Initialize Mecab from konlpy (0.6.0)
2930
Initialize Kkma from konlpy (0.6.0)
3031
Initialize Hannanum from konlpy (0.6.0)
3132
Initialize Okt from konlpy (0.6.0)
32-
kiwi komoran mecab kkma hannanum okt
33-
irregular_verbs.txt 0.776 0.463 0.463 0.522 0.463 0.463
34-
verb_vs_adj.txt 0.907 0.407 0.537 0.463 - -
35-
nouns.txt 0.891 0.545 0.600 0.709 0.473 0.527
36-
distant.txt 0.613 0.419 0.548 0.419 - -
33+
Initialize khaiii (0.4)
34+
kiwi kiwi_sbg komoran mecab kkma hannanum okt khaiii
35+
distant.txt 0.581 0.774 0.419 0.548 0.419 - - 0.484
36+
irregular_verbs.txt 0.821 0.896 0.463 0.463 0.522 0.463 0.463 0.552
37+
nouns.txt 0.891 0.891 0.545 0.600 0.709 0.473 0.527 0.673
38+
verb_vs_adj.txt 0.907 0.907 0.407 0.537 0.463 - - 0.611
3739
```
3840

39-
`Hannanum``Okt`의 경우 동사와 형용사를 별도로 구분하는 기능이 없어서 `verb_vs_adj`이나 `distant` 평가에서 점수를 매기지 않습니다.
41+
`Hannanum``Okt`의 경우 동사와 형용사를 별도로 구분하는 기능이 없어서 `verb_vs_adj`이나 `distant` 평가에서 점수를 매기지 않습니다.

0 commit comments

Comments
 (0)