v3.0.2
v3.0.2版本,新增部分功能,修复和优化部分问题,更新点如下:
功能新增和优化:
- OCR类模型默认下载源从
BOS改为HuggingFace,同时也支持用户通过更改环境变量PADDLE_PDX_MODEL_SOURCE为BOS,将模型下载源设置为百度云对象存储BOS。 - 新增PP-OCRv5的Android端示例,详情。
- 优化PP-StructureV3产线中版面分区排序算法,对复杂竖版版面排序逻辑进行完善,进一步提升了复杂版面排序效果。
- 为MKL-DNN缓存大小设置默认上界,防止缓存无限增长。同时,支持用户配置缓存容量。@timminator
- 更新高性能推理默认配置,支持Paddle MKL-DNN加速。优化高性能推理自动配置逻辑,支持更智能的配置选择。
- 调整默认设备获取逻辑,考虑环境中安装的Paddle框架对计算设备的实际支持情况,使程序行为更符合直觉。
- 模型与环境支持时,CPU下默认启用MKLDNN推理后端。
- 优化语义分割模块数据校验部分,并在数据格式错误时抛出详细引导信息。
Bug修复:
- 修复基础服务化部署在使用MKL-DNN时可能出现的多线程错误。
- 修复Latex-OCR模型的图像预处理的通道顺序错误。
- 修复文本识别模块保存可视化图像的通道顺序错误。
- 修复PP-StructureV3中表格可视化结果通道顺序错误。
- 修复PP-StructureV3产线中极特殊的情况下,计算overlap_ratio时,变量溢出问题。
其他:
- 放松numpy、pandas、等依赖的版本限制,恢复对Python 3.12的支持。
- 限制pycocotools版本号,避免其更新带来的不兼容问题。