-
Notifications
You must be signed in to change notification settings - Fork 5
Open
Description
@kba asked me to put this comment from a private Gitter conversation into an issue:
bzgl. "input PAGE-XML not having words" wäre mein Input, dass ich damit leben kann wenn PAGE ohne Word-Elemente einfach nicht konvertiert werden kann. Meine Meinung wäre sogar, dass eine Wortsegementierung an dieser Stelle nicht angebracht wäre und das entweder die Layoutsegmentierung oder die OCR machen sollte. (Die OCR auch nur weil aus den CTC-Positionen eine für manche Zweke brauchbare Glyphsegmentierung als Abfallprodukt abfällt und das relativ einfach sich auf Wörter übertragen lässt, wie in ocrd_calamari)
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels