feat(tokenizers): add experimental Korean tokenizer by dayongkr · Pull Request #1018 · oramasearch/orama

dayongkr · 2026-02-16T05:32:47Z

Why add Korean support?

@orama/tokenizers currently supports experimental CJK tokenizers for Japanese and
Mandarin, but not Korean.
This makes Korean text search inconsistent compared to other CJK languages.

Adding a Korean tokenizer:

enables proper Korean word segmentation for indexing/search
keeps language support more consistent across CJK
provides an official import path for Korean users (@orama/tokenizers/korean)

What changed

New tokenizer

Added packages/tokenizers/src/korean.ts
- Implements Korean tokenization using Intl.Segmenter("ko", { granularity: "word" })
- Follows the same structure and behavior as existing Japanese/Mandarin tokenizers

Exports and package wiring

Updated packages/tokenizers/src/index.ts
- Added korean tokenizer export
Updated packages/tokenizers/package.json
- Added ./korean export entries (ESM/CJS types + runtime files)
- Included Korean test in the package test script
- Added korean keyword

Tests

Added packages/tokenizers/tests/korean.test.ts
- Validates Korean tokenization/search behavior with Korean city and university names
- Keeps style aligned with existing Japanese/Mandarin tokenizer tests

feat(tokenizers): add experimental korean tokenizer

d45b5de

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

feat(tokenizers): add experimental Korean tokenizer#1018

feat(tokenizers): add experimental Korean tokenizer#1018
dayongkr wants to merge 1 commit into
oramasearch:mainfrom
dayongkr:add-korean-tokenizer

dayongkr commented Feb 16, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Uh oh!

Conversation

dayongkr commented Feb 16, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Why add Korean support?

What changed

New tokenizer

Exports and package wiring

Tests

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

dayongkr commented Feb 16, 2026 •

edited

Loading