-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
Het standaard soundex-algoritme is niet ideaal voor Nederlandse namen. Het probleem is niet dat je te veel matches krijgt, maar dat het belangrijke matches mist. Weinand en Wijnand krijgen verschillende codes.
We kunnen op zoek naar een Nederlandse variant van soundex.
Of we kunnen namen voorbewerken voordat je soundex erop loslaat. Bijvoorbeeld deze omzettingen:
- accenten verwijderen
- eij → y
- ey → y
- ei → y
- ij → y
- x → ks
- ch → x
- oud → old
- out → olt
- j → i
- w → v
- c als beginletter → k
Over regels 8 en 9 ben ik minder zeker. Het helpt voor het vinden van varianten zoals Wouters / Wolters.
Regel 12 is voor namen met C of K als beginletter: Cornelis / Kornelis
Omdat AllegroGraph niet de mogelijkheid biedt eigen zoekfilters toe te voegen moet je de Nederlandse codes opnemen in de data.
Metadata
Metadata
Assignees
Labels
No labels