我使用python demo_text_detection.py --checkpoint pretrained_checkpoint/word_detection_totaltext.pth --model-type vit_h --input demo/001.jpg --output demo/ --dataset totaltext测试了一下自己的图片(纯文本的图片),发现漏了很多单词,第一张图漏了少量单词,第二张图大部分都漏了,这个是不是因为没有针对这种纯文本的数据进行训练的原因呢?  