Skip to content

Commit c9accd2

Browse files
authored
Merge pull request #28 from cikay/derbare-derheqe
Derbare derheqe
2 parents 3ae5357 + 96f7a90 commit c9accd2

2 files changed

Lines changed: 24 additions & 0 deletions

File tree

README.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -21,6 +21,10 @@ result = kmr_standardizer.standardize(text)
2121

2222
**Preposition standardization**
2323
- `di ... de``di ... da` (e.g., *di mal de**di mal da*)
24+
- `derbarê ... de``derbarê ... da` (e.g., *derbarê vê mijarê de**derbarê vê mijarê da*)
25+
- `der barê ... de``der barê ... da` (e.g., *der barê vê mijarê de**derbarê vê mijarê da*)
26+
- `derheqê ... de``derheqê ... da` (e.g., *derheqê vê mijarê de**derheqê vê mijarê da*)
27+
- `der heqê ... de``der heqê ... da` (e.g., *der heqê vê mijarê de**der heqê vê mijarê da*)
2428
- `tê de``tê da` (e.g., *tê de ew peyv jî heye**tê da ew peyv jî heye*)
2529
- `re``ra` (e.g., *bi muzîkê re**bi muzîkê ra*)
2630

tests/test_prepositions.py

Lines changed: 20 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -171,23 +171,43 @@ def test_derbare_de(self, processor):
171171
expected = "Sedema zehmetbûna diyarkirina çîrokên Şahnameyên Kurdî berî her tiştî ev e ku hejmareka nediyar ya destxetên Kurdî di kitêbxaneyên cuda yên dinyayê de di bin navê zimanekî din de hatine qeydkirin û ev yek jî bûye sedem ku vekolînên derbarê edebiyata Kurdî da bi zehmet bikevin"
172172
assert processor.process(text) == expected
173173

174+
def test_derbare_de_multiple_space(self, processor):
175+
text = "derbarê vê mijarê de"
176+
expected = "derbarê vê mijarê da"
177+
assert processor.process(text) == expected
178+
174179
def test_der_bare_de(self, processor):
175180
text = "Hestên neteweyî û helwesta axêverên wî zimanî ya der barê zimanê wan de"
176181
expected = (
177182
"Hestên neteweyî û helwesta axêverên wî zimanî ya der barê zimanê wan da"
178183
)
179184
assert processor.process(text) == expected
180185

186+
def test_der_bare_de_multiple_space(self, processor):
187+
text = "der barê vê mijarê de"
188+
expected = "der barê vê mijarê da"
189+
assert processor.process(text) == expected
190+
181191
def test_der_heqe_de(self, processor):
182192
text = "Lê bi kurtasî be jî, ez dixwazim dîsan çend gotinan der heqê vê yekê de bibêjim."
183193
expected = "Lê bi kurtasî be jî, ez dixwazim dîsan çend gotinan der heqê vê yekê da bibêjim."
184194
assert processor.process(text) == expected
185195

196+
def test_der_heqe_de_multiple_space(self, processor):
197+
text = "der heqê vê mijarê de"
198+
expected = "der heqê vê mijarê da"
199+
assert processor.process(text) == expected
200+
186201
def test_derheqe_de(self, processor):
187202
text = "Tişta gelekî balkêş a derheqê babilîyan de ev e ji bo hesabên xwe tablo çêdikirin."
188203
expected = "Tişta gelekî balkêş a derheqê babilîyan da ev e ji bo hesabên xwe tablo çêdikirin."
189204
assert processor.process(text) == expected
190205

206+
def test_derheqe_de_multiple_space(self, processor):
207+
text = "derheqê vê mijarê de"
208+
expected = "derheqê vê mijarê da"
209+
assert processor.process(text) == expected
210+
191211
# def replace_does_not_match(self):
192212
# text = "Berginda vê peyvê ya din jî “der barê… de” ye ku ew jî eynî mîna wê ne xwedî standardeke nivîsînê ye."
193213
# assert processor.process(text) == text

0 commit comments

Comments
 (0)