Skip to content

Commit a00519d

Browse files
committed
Update workflows
1 parent 70116db commit a00519d

File tree

7 files changed

+8
-30
lines changed

7 files changed

+8
-30
lines changed

Diff for: .github/workflows/arm64_centos7.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -44,7 +44,7 @@ jobs:
4444
KIWI_ARCH_TYPE=balanced ./build/kiwi-cli-* -m ./models/base -e -o test.out kowiki1000.txt
4545
KIWI_ARCH_TYPE=neon ./build/kiwi-cli-* -m ./models/base -e -o test.out kowiki1000.txt
4646
- name: Archive binaries
47-
uses: actions/upload-artifact@v3
47+
uses: actions/upload-artifact@v4
4848
with:
4949
name: Artifacts Arm64-Centos7
5050
path: |

Diff for: .github/workflows/centos7.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -44,7 +44,7 @@ jobs:
4444
./build/kiwi-evaluator -m ./models/base eval_data/*.txt --sbg -o eval_results/
4545
- run: tar -zcvf arts.tgz build/*kiwi* build/test/*kiwi* eval_results/*.txt build/bindings/java/*.jar
4646
- name: Archive binaries
47-
uses: actions/upload-artifact@v3
47+
uses: actions/upload-artifact@v4
4848
with:
4949
name: Artifacts Centos7
5050
path: arts.tgz

Diff for: .github/workflows/macos.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -80,7 +80,7 @@ jobs:
8080
KIWI_ARCH_TYPE=neon ./build/kiwi-cli-* -m ./models/base -e -o test.out --typos 6 kowiki1000.txt
8181
fi
8282
- name: Archive binaries
83-
uses: actions/upload-artifact@v3
83+
uses: actions/upload-artifact@v4
8484
with:
8585
name: Artifacts ${{ matrix.name }}
8686
path: |

Diff for: .github/workflows/ppc64le_centos7.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -32,7 +32,7 @@ jobs:
3232
cp -r build /artifacts/
3333
cp -r eval_results /artifacts/
3434
- name: Archive binaries
35-
uses: actions/upload-artifact@v3
35+
uses: actions/upload-artifact@v4
3636
with:
3737
name: Artifacts PPC64LE-Centos7
3838
path: |

Diff for: .github/workflows/ubuntu.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -75,7 +75,7 @@ jobs:
7575
KIWI_ARCH_TYPE=avx512bw ./build/kiwi-cli-* -m ./models/base -e -o test.out --sbg kowiki1000.txt
7676
KIWI_ARCH_TYPE=avx512bw ./build/kiwi-cli-* -m ./models/base -e -o test.out --typos 6 kowiki1000.txt
7777
- name: Archive binaries
78-
uses: actions/upload-artifact@v3
78+
uses: actions/upload-artifact@v4
7979
with:
8080
name: Artifacts ${{ matrix.name }}
8181
path: |

Diff for: .github/workflows/windows.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -38,7 +38,7 @@ jobs:
3838
.\build\Release\kiwi-evaluator.exe -m .\models\base (Get-ChildItem eval_data\*.txt | Select-Object -Expand FullName) -o eval_results\
3939
.\build\Release\kiwi-evaluator.exe -m .\models\base --sbg (Get-ChildItem eval_data\*.txt | Select-Object -Expand FullName) -o eval_results\
4040
- name: Archive binaries
41-
uses: actions/upload-artifact@v3
41+
uses: actions/upload-artifact@v4
4242
with:
4343
name: Artifacts ${{ matrix.os }} ${{ matrix.arch }}bit
4444
path: |

Diff for: test/test_cpp.cpp

+2-24
Original file line numberDiff line numberDiff line change
@@ -1676,29 +1676,7 @@ TEST(KiwiCpp, Issue205)
16761676

16771677
TEST(KiwiCpp, IssueP195)
16781678
{
1679-
Kiwi kiwi = KiwiBuilder{ MODEL_PATH, 0, BuildOption::default_, ModelType::sbg }.build(DefaultTypoSet::basicTypoSetWithContinualAndLengthening);
1680-
auto res = kiwi.analyze(u8"“타지크인은 …… 사마르칸트와 부하라를 우즈베키스탄으로 할당한 사실에 대해 매우 고통스러워했다. 타지크인에게 두 도시는 프랑스의 파리와 같은 의미를 지닌 도시였다.” - 131쪽"
1681-
u8"\xa0\xa0중앙아시아는 서쪽의 카스피해에서 동쪽의 천산산맥까지, 그리고 남쪽의 아프가니스탄에서 북쪽의 러시아 타이가 지대까지 뻗어있다. 우즈베키스탄, 카자흐스탄, 키르기스스탄, 타지키스탄, "
1682-
u8"투르크메니스탄 등 5개의 구소련 공화국이 있는 이 지역의 총면적은 4,003,451㎢로 한국의 약 40배에 달한다. 중앙아시아는 아시아와 유럽을 연결하는 실크로드의 중심으로 수십 세기 동안 수많은 제국과 "
1683-
u8"국가들이 흥망성쇠를 거듭했다. 또한, 다양한 유목민의 이동 통로였는데, 고대 스키타이족부터 돌궐족, 페르시아 왕조, 몽골족, 그리고 투르크족이 중앙아시아를 지배했다. 19세기 중반부터 20세기 말까지 "
1684-
u8"중앙아시아는 러시아와 소비에트 제국령이었다. \xa0\xa0유목민은 역사를 기록으로 남기지 않는다. 이러한 이유로 중앙아시아의 역사는 수많은 논쟁과 국가 이데올로기의 경쟁 무대가 되었으며, 그 역사는 "
1685-
u8"원주민의 언어가 아니라 페르시아어, 아랍어, 몽골어, 중국어, 러시아어 등으로 연구할 수밖에 없다. 최근 들어 한국 중앙아시아 학계에서도 이 지역 연구에 관한 중요한 업적들이 하나둘씩 소개되고 있다. "
1686-
u8"과거 영미 학자들의 번역서에서 이후 중국어와 러시아어를 바탕으로 이 지역을 심층적으로 연구하는 논문과 책들이 쏟아져 나왔다. 최근에는 페르시아어와 몽골 큽착어와 우즈베크어 등 투르크어를 "
1687-
u8"원전으로 하는 연구들 또한 빠르게 진행되고 있다. \xa0\xa0정세진 교수의 『쉽게 읽는 중앙아시아 이야기』는 러시아어 원전을 바탕으로 쓴 중앙아시아 역사서이다. 정 교수는 이 책에서 중앙아시아 "
1688-
u8"역사의 가장 논쟁적인 초점인 ‘우즈베크-타지크 역사 기원과 논쟁’을 다루고 있는데 이 내용은 다른 어떤 중앙아시아 관련 서적에서 나오지 않는 내용이다. 흔히 중앙아시아의 황금시대는 S. 프레더릭 "
1689-
u8"스타의 『잃어버린 계몽의 시대』에서 잘 묘사한 9∼15세기 부하라와 사마르칸트이다. 당시 부하라는 세계 최고의 과학 문명을 자랑했으며 정복자 티무르는 사마르칸트에 기념비적인 건축물을 남겼다. "
1690-
u8"문제는 이것이 누구의 유산인가 하는 것이다. \xa0\xa0\x31\x39\x39\x31년 중앙아시아 국가들은 갑작스러운 소연방의 해체 이후 준비되지 않은 상태에서 독립을 맞이하게 되었다. 소련공산당 핵심 당원이었던 "
1691-
u8"중앙아시아 지도자들은 그들의 지위를 영원히 보장할 수 있는 절호의 기회임을 깨닫고, 공산주의를 버리고 민족주의를 내세우게 된다. 그들은 구소련이 인위적으로 그어준 소비에트 공화국을 민족의 경계 "
1692-
u8"구역으로 확정하고, 나아가 공화국의 이름으로 새로운 민족을 창조해나간다. 1992년부터 중앙아시아 모든 국가는 과거 구소련 시절에 유명무실했던 ‘공화국 역사연구소’를 가장 중요한 국책 연구소로 "
1693-
u8"승격시키고 엄청난 예산을 쏟아부어 신화 창조에 나서게 된다. 우즈베키스탄의 카리모프 대통령은 우즈베크인과 전혀 상관없는 투르크인 아미르 티무르를 우즈베키스탄의 건국 시조로 규정하고, 수도 "
1694-
u8"타슈켄트의 도시공원에 놓인 엥겔스의 동상을 치우고 티무르의 동상을 올렸다. 카자흐스탄의 나자르바예프 대통령은 유목 민족 카자흐의 조상은 고대 스키타이인이며 이들은 흉노와 돌궐, 그리고 "
1695-
u8"카자흐까지 이어졌다는 주장을 무려 자신의 이름으로 논문화하여 발표한다. \xa0\xa0투르크메니스탄의 나야조프 초대 대통령은 투르크멘 민족 창조까지는 시도하지 않았지만, 자신과 자신의 일가를 "
1696-
u8"절대 우상화하여 다른 중앙아시아 국가와의 차별성을 강조했다. 이러한 역사 창조 과정에서 가장 소외된 국가는 타지키스탄이었다. 타지키스탄은 1992년 발생한 내전으로 국토의 3분의 1이 전쟁터화되고, "
1697-
u8"수많은 난민이 발생하면서 역사에 관심을 쏟을 여유가 없었다. 이 결과, 타지키스탄은 자신의 가장 중요한 유산인 중앙아시아의 황금시대를 우즈베키스탄에 그냥 넘겨주게 되었다. 우즈베키스탄은 자신의 "
1698-
u8"역사가 실크로드의 역사라고 주장하지만, 이것은 전혀 사실에 맞지 않는다. 7세기부터 15세기까지 동서양을 연결하는 실크로드 역사의 주역은 타지크족인 소그드였으며, 이들은 페르시아의 문명을 받아들여 "
1699-
u8"9세기에 세계 최고의 과학기술을 자랑했다.\xa0\xa0정세진 교수는 타지키스탄의 역사학자인 가푸로프와 마소프의 논문을 추적하여 타지키스탄이 실크로드, 부하라와 사마르칸트 황금시대의 주역이었음을 "
1700-
u8"규명한다. 이에 대항하는 우즈베키스탄 역사학자는 타지크족이 산악 민족이라고 반박하지만, 이들의 주장은 별 설득력이 없다. 오늘날 사마르칸트 인구의 절반 이상은 타지크족이며 이들은 자신의 영혼은 "
1701-
u8"부하라와 사마르칸트에 닿아 있다고 믿는다. 정세진 교수의 이 기념비적인 작품은 향후 후학들이 러시아어가 아닌 페르시아어, 큽착 몽골어 등으로 더 규명하여야 할 것이다. 이 책에서 가장 아쉬운 점은 "
1702-
u8"결론 장이 없다는 점이다. 논쟁적인 주장들과 중앙아시아의 문명사적 특징을 결론에서 잘 정리했다면 독자들의 이해를 도왔을 것이다.\n", Match::all);
1679+
Kiwi kiwi = KiwiBuilder{ MODEL_PATH, 0, BuildOption::default_, true }.build(DefaultTypoSet::basicTypoSetWithContinualAndLengthening);
1680+
auto res = kiwi.analyze(u"정 교수는 이 책에서 중앙아시아 역사의 가장 논쟁적인 초점인 ‘우즈베크\uff0d타지크 역사 기원과 논쟁’을 다루고 있는데\n", Match::all);
17031681
EXPECT_TRUE(res.first.size() > 0);
17041682
}

0 commit comments

Comments
 (0)