您好,想请教您一下,video层面的crop, ``` s_x, e_x, s_y, e_y = item["metadata"]["crop"] ``` ,请问您在进行数据处理时为什么对部分video采用了整体的bbox裁剪呢?我发现有些裁剪出来的视频,人物的面部在切分后不完整,比如 <img width="942" height="505" alt="Image" src="https://github.com/user-attachments/assets/ada6e1b4-0a70-4ed4-a64d-73afe033b7eb" />,请问这样的结果是否是合理的呢?
您好,想请教您一下,video层面的crop,
,请问您在进行数据处理时为什么对部分video采用了整体的bbox裁剪呢?我发现有些裁剪出来的视频,人物的面部在切分后不完整,比如