PaddleDetection 关键点检测能力紧跟业内最新最优算法方案,包含Top-Down、Bottom-Up两套方案,Top-Down先检测主体,再检测局部关键点,优点是精度较高,缺点是速度会随着检测对象的个数增加,Bottom-Up先检测关键点再组合到对应的部位上,优点是速度快,与检测对象个数无关,缺点是精度较低。
检测模型 | 关键点模型 | 输入尺寸 | COCO数据集精度 | 平均推理耗时 (FP16) | 参数量 (M) | Flops (G) | 模型权重 | Paddle-Lite部署模型(FP16) |
PicoDet-S-Pedestrian | PP-TinyPose | 检测:192x192 关键点:128x96 |
检测mAP:29.0 关键点AP:58.1 |
检测耗时:2.37ms 关键点耗时:3.27ms |
检测:1.18 关键点:1.36 |
检测:0.35 关键点:0.08 |
检测 关键点 |
检测 关键点 |
PicoDet-S-Pedestrian | PP-TinyPose | 检测:320x320 关键点:256x192 |
检测mAP:38.5 关键点AP:68.8 |
检测耗时:6.30ms 关键点耗时:8.33ms |
检测:1.18 关键点:1.36 |
检测:0.97 关键点:0.32 |
检测 关键点 |
检测 关键点 |
检测模型 | 关键点模型 | 输入尺寸 | COCO数据集精度 | 参数量 (M) | Flops (G) | 模型权重 |
PP-YOLOv2 | HRNet-w32 | 检测:640x640 关键点:384x288 |
检测mAP:49.5 关键点AP:77.8 |
检测:54.6 关键点:28.6 |
检测:115.8 关键点:17.3 |
检测 关键点 |
PP-YOLOv2 | HRNet-w32 | 检测:640x640 关键点:256x192 |
检测mAP:49.5 关键点AP:76.9 |
检测:54.6 关键点:28.6 |
检测:115.8 关键点:7.68 |
检测 关键点 |
模型 | 方案 | 输入尺寸 | AP(coco val) | 模型下载 | 配置文件 |
HigherHRNet-w32 | Bottom-Up | 512 | 67.1 | higherhrnet_hrnet_w32_512.pdparams | config |
HigherHRNet-w32 | Bottom-Up | 640 | 68.3 | higherhrnet_hrnet_w32_640.pdparams | config |
HigherHRNet-w32+SWAHR | Bottom-Up | 512 | 68.9 | higherhrnet_hrnet_w32_512_swahr.pdparams | config |
HRNet-w32 | Top-Down | 256x192 | 76.9 | hrnet_w32_256x192.pdparams | config |
HRNet-w32 | Top-Down | 384x288 | 77.8 | hrnet_w32_384x288.pdparams | config |
HRNet-w32+DarkPose | Top-Down | 256x192 | 78.0 | dark_hrnet_w32_256x192.pdparams | config |
HRNet-w32+DarkPose | Top-Down | 384x288 | 78.3 | dark_hrnet_w32_384x288.pdparams | config |
WiderNaiveHRNet-18 | Top-Down | 256x192 | 67.6(+DARK 68.4) | wider_naive_hrnet_18_256x192_coco.pdparams | config |
LiteHRNet-18 | Top-Down | 256x192 | 66.5 | lite_hrnet_18_256x192_coco.pdparams | config |
LiteHRNet-18 | Top-Down | 384x288 | 69.7 | lite_hrnet_18_384x288_coco.pdparams | config |
LiteHRNet-30 | Top-Down | 256x192 | 69.4 | lite_hrnet_30_256x192_coco.pdparams | config |
LiteHRNet-30 | Top-Down | 384x288 | 72.5 | lite_hrnet_30_384x288_coco.pdparams | config |
备注: Top-Down模型测试AP结果基于GroundTruth标注框
模型 | 方案 | 输入尺寸 | PCKh(Mean) | PCKh([email protected]) | 模型下载 | 配置文件 |
HRNet-w32 | Top-Down | 256x256 | 90.6 | 38.5 | hrnet_w32_256x256_mpii.pdparams | config |
我们同时推出了基于LiteHRNet(Top-Down)针对移动端设备优化的实时关键点检测模型PP-TinyPose, 欢迎体验。
模型 | 输入尺寸 | AP (COCO Val) | 单人推理耗时 (FP32) | 单人推理耗时(FP16) | 配置文件 | 模型权重 | 预测部署模型 | Paddle-Lite部署模型(FP32) | Paddle-Lite部署模型(FP16) |
PP-TinyPose | 128*96 | 58.1 | 4.57ms | 3.27ms | Config | Model | 预测部署模型 | Lite部署模型 | Lite部署模型(FP16) |
PP-TinyPose | 256*192 | 68.8 | 14.07ms | 8.33ms | Config | Model | 预测部署模型 | Lite部署模型 | Lite部署模型(FP16) |
请参考PaddleDetection 安装文档正确安装PaddlePaddle和PaddleDetection即可。
- 请注意,Top-Down方案使用检测框测试时,需要通过检测模型生成bbox.json文件。COCO val2017的检测结果可以参考Detector having human AP of 56.4 on COCO val2017 dataset,下载后放在根目录(PaddleDetection)下,然后修改config配置文件中
use_gt_bbox: False
#COCO DataSet
CUDA_VISIBLE_DEVICES=0 python3 tools/train.py -c configs/keypoint/higherhrnet/higherhrnet_hrnet_w32_512.yml
#MPII DataSet
CUDA_VISIBLE_DEVICES=0 python3 tools/train.py -c configs/keypoint/hrnet/hrnet_w32_256x256_mpii.yml
#COCO DataSet
CUDA_VISIBLE_DEVICES=0,1,2,3 python3 -m paddle.distributed.launch tools/train.py -c configs/keypoint/higherhrnet/higherhrnet_hrnet_w32_512.yml
#MPII DataSet
CUDA_VISIBLE_DEVICES=0,1,2,3 python3 -m paddle.distributed.launch tools/train.py -c configs/keypoint/hrnet/hrnet_w32_256x256_mpii.yml
#COCO DataSet
CUDA_VISIBLE_DEVICES=0 python3 tools/eval.py -c configs/keypoint/higherhrnet/higherhrnet_hrnet_w32_512.yml
#MPII DataSet
CUDA_VISIBLE_DEVICES=0 python3 tools/eval.py -c configs/keypoint/hrnet/hrnet_w32_256x256_mpii.yml
CUDA_VISIBLE_DEVICES=0 python3 tools/eval.py -c configs/keypoint/higherhrnet/higherhrnet_hrnet_w32_512.yml --save_prediction_only
CUDA_VISIBLE_DEVICES=0 python3 tools/infer.py -c configs/keypoint/higherhrnet/higherhrnet_hrnet_w32_512.yml -o weights=./output/higherhrnet_hrnet_w32_512/model_final.pdparams --infer_dir=../images/ --draw_threshold=0.5 --save_txt=True
python tools/export_model.py -c configs/ppyolo/ppyolov2_r50vd_dcn_365e_coco.yml -o weights=https://paddledet.bj.bcebos.com/models/ppyolov2_r50vd_dcn_365e_coco.pdparams
python tools/export_model.py -c configs/keypoint/hrnet/hrnet_w32_256x192.yml -o weights=https://paddledet.bj.bcebos.com/models/keypoint/hrnet_w32_256x192.pdparams
#detector 检测 + keypoint top-down模型联合部署(联合推理只支持top-down方式)
python deploy/python/det_keypoint_unite_infer.py --det_model_dir=output_inference/ppyolo_r50vd_dcn_2x_coco/ --keypoint_model_dir=output_inference/hrnet_w32_384x288/ --video_file=../video/xxx.mp4 --device=gpu
python tools/export_model.py -c configs/keypoint/higherhrnet/higherhrnet_hrnet_w32_512.yml -o weights=output/higherhrnet_hrnet_w32_512/model_final.pdparams
python deploy/python/keypoint_infer.py --model_dir=output_inference/higherhrnet_hrnet_w32_512/ --image_file=./demo/000000014439_640x640.jpg --device=gpu --threshold=0.5
python tools/export_model.py -c configs/mot/fairmot/fairmot_dla34_30e_1088x608.yml -o weights=https://paddledet.bj.bcebos.com/models/mot/fairmot_dla34_30e_1088x608.pdparams
python deploy/python/mot_keypoint_unite_infer.py --mot_model_dir=output_inference/fairmot_dla34_30e_1088x608/ --keypoint_model_dir=output_inference/higherhrnet_hrnet_w32_512/ --video_file={your video name}.mp4 --device=GPU
注意: 跟踪模型导出教程请参考文档。
我们提供了PaddleInference(服务器端)、PaddleLite(移动端)、第三方部署(MNN、OpenVino)支持。无需依赖训练代码,deploy文件夹下相应文件夹提供独立完整部署代码。 详见 部署文档介绍。
num_joints: &num_joints 17 #自定义数据的关键点数量
train_height: &train_height 256 #训练图片尺寸-高度h
train_width: &train_width 192 #训练图片尺寸-宽度w
hmsize: &hmsize [48, 64] #对应训练尺寸的输出尺寸,这里是输入[w,h]的1/4
flip_perm: &flip_perm [[1, 2], [3, 4], [5, 6], [7, 8], [9, 10], [11, 12], [13, 14], [15, 16]] #关键点定义中左右对称的关键点,用于flip增强。若没有对称结构在 TrainReader 的 RandomFlipHalfBodyTransform 一栏中 flip_pairs 后面加一行 "flip: False"(注意缩紧对齐)
num_joints_half_body: 8 #半身关键点数量,用于半身增强
prob_half_body: 0.3 #半身增强实现概率,若不需要则修改为0
upper_body_ids: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10] #上半身对应关键点id,用于半身增强中获取上半身对应的关键点。
- keypoint_utils.py中的sigmas = np.array([.26, .25, .25, .35, .35, .79, .79, .72, .72, .62, .62, 1.07, 1.07,.87, .87, .89, .89]) / 10.0,表示每个关键点的确定范围方差,根据实际关键点可信区域设置,区域精确的一般0.25-0.5,例如眼睛。区域范围大的一般0.5-1.0,例如肩膀。若不确定建议0.75。
- visualizer.py中的draw_pose函数中的EDGES,表示可视化时关键点之间的连接线关系。
- pycocotools工具中的sigmas,同第一个keypoint_utils.py中的设置。用于coco指标评估时计算。
- 训练数据请按coco数据格式处理。需要包括关键点[Nx3]、检测框[N]标注。
- 请注意area>0,area=0时数据会被过滤掉。
我们给出了不同运行环境下的测试结果,供您在选用模型时参考。详细数据请见Keypoint Inference Benchmark。
