Python例程

序号	Python例程	说明
1	qwen2_5_vl.py	使用SAIL推理

1. 环境准备

注意： 无论哪个环境，都要求transformers>=4.49.0，该版本要求python版本大于3.10。若不满足，请参考python3.10安装安装。

1.1 x86/arm PCIe平台

需要SDK v24.04.01及其以上版本
如果您在x86/arm平台安装了PCIe加速卡（如SC系列加速卡），并使用它测试本例程，您需要安装libsophon、sophon-opencv、sophon-ffmpeg，具体请参考x86-pcie平台的开发和运行环境搭建或arm-pcie平台的开发和运行环境搭建。
此外您可能还需要安装其他库：

pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade
pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

您还需要安装sophon-sail，由于本例程需要的sophon-sail版本较新，可以用如下命令安装sophon-sail。

pip3 install dfss --upgrade
python3 -m dfss --install sail

需要下载运行配置文件，执行如下命令

python3 -m dfss --url=open@sophgo.com:sophon-demo/Qwen2_5_VL/configs.zip
unzip configs.zip
rm configs.zip

1.2 SoC平台

需要SDK v24.04.01及其以上版本
如果您使用SoC平台（如SE、SM系列边缘设备），并使用它测试本例程，请使用SDK V24.04.01及其以上版本对应的刷机包进行刷机，刷机成功后在/opt/sophon/下已经预装了相应的libsophon、sophon-opencv和sophon-ffmpeg运行库包。
此外您可能还需要安装其他库：

pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade
pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

您需要安装SILK2.Tools.logger：

python3 -m dfss --url=open@sophgo.com:tools/silk2/silk2.tools.logger-1.0.2-py3-none-any.whl
pip3 install silk2.tools.logger-1.0.2-py3-none-any.whl --force-reinstall
rm -f silk2.tools.logger-1.0.2-py3-none-any.whl

本例程依赖sophon-sail，可直接安装sophon-sail，执行如下命令：

pip3 install dfss --upgrade
python3 -m dfss --install sail

需要下载运行配置文件，执行如下命令

python3 -m dfss --url=open@sophgo.com:sophon-demo/Qwen2_5_VL/configs.zip
unzip configs.zip
rm configs.zip

2. 推理测试

python例程不需要编译，可以直接运行，PCIe平台和SoC平台的测试参数和运行方式是相同的。

2.1 参数说明

usage: qwen2_5_vl.py [-h] [-m BMODEL_PATH] [-c CONFIG_PATH] [-d DEV_ID] [-vi VISION_INPUTS [VISION_INPUTS ...]]  [-ll {DEBUG,INFO,WARNING,ERROR}] [--do_sample]
--bmodel_path: 用于推理的bmodel路径；
--config_path: 模型配置文件路径；
--dev_id: 用于推理的tpu设备id；
--vision_inputs: json格式，输入图片、视频文件路径、视觉预处理参数，可接受多个图片输入，格式：[{"type":"video_url","video_url":path-to-video/list(path-to-frame image), ...},{"type":"video_url","video_url":path-to-video/list(path-to-frame image), ...},{"type":"video_url","image":path-to-image, ...},...]。其中字典里面的其他参数用于生成prompt的额外视觉预处理参数，例如可设置"resized_height"、"resized_width"、"min_pixels"、"max_pixels"等，与官方支持的输入一致，在内存不足时，可适当设置这些参数，支持的常用参数说明如下：
    * --resize_type: 采样方法，支持INTER_NEAREST、INTER_LINEAR、INTER_BICUBIC、Origin，如果不传，默认为INTER_LINEAR，若需要保持原图大小，则需要传入Origin
    * --max_side: 指定最大边的长度，保持纵横比缩放, 0时表示自适应缩小，-1时表示完全自适应，包含放大和缩小，其他值是表示缩放后最大边长的长度，如果不传，默认为0。
    * --resized_height: resize后的固定高度，会进行28对齐，即28的倍数；
    * --resized_width: resize后的固定宽度，会进行28对齐，即28的倍数；
    * --min_pixels: resize后的最小像素点数量，像素点数量是图片高度乘以宽度，若小于该像素数量会重新计算高宽的缩放比例，最终高度宽度也会进行28对齐，即28的倍数，若--resized_height和--resized_width设置，则该参数无效；
    * --max_pixels: resize后的最大像素点数量，像素点数量是图片高度乘以宽度，若大于该像素数量会重新计算高宽的缩放比例，最终高度宽度也会进行28对齐，即28的倍数，若--resized_height和--resized_width设置，则该参数无效；
    * --video_sample_num: 输入到模型推理的视频帧数量，仅对输入为单一视频文件有用，对于输入一系列视频帧图片和图片输入无效；
    * --nframes: 均匀采样得到的视频帧数量，可以通过该参数实现抽帧；
    * --video_start: 设置需要处理的视频起始帧；
    * --video_end: 设置需要处理的视频结束帧；
--log_level: log等级，支持DEBUG、INFO、WARNING、ERROR，默认为INFO。
--do_sample: 是否执行重复惩罚采样，默认为false。

2.2 使用方式

为了测试视频../datasets/videos/carvana_video.mp4，设置resized_height、resized_width参数到合适的值，并设置nframes参数为处理2帧，可以使用如下命令

python3 qwen2_5_vl.py --vision_inputs="[{\"type\":\"video_url\",\"video_url\":{\"url\": \"../datasets/videos/carvana_video.mp4\"},\"resized_height\":420,\"resized_width\":630,\"nframes\":2}]"

在测试视频较大的时候，如果报错available memory not suffice to load data，可以考虑使用pyav库来读取视频，需要设置环境变量：

export FORCE_QWENVL_VIDEO_READER=pyav

为了测试图片../datasets/images/panda.jpg，设置max_side参数到合适的值，可以参考执行如下命令

python3 qwen2_5_vl.py --vision_inputs="[{\"type\":\"image_url\",\"image_url\":{\"url\": \"../datasets/images/panda.jpg\"}, \"max_side\":420}]"

为了纯文本对话，可以参考执行如下命令

python3 qwen2_5_vl.py --vision_inputs=""

在Question: 处进行提问，例如：Describe this video。终端将打印FTL、TPS性能数据，并输出回答结果，接着可进一步对视频进行提问，输入q即可退出。

测试说明：

图片或者视频尺寸越大，一般精度越高，直到达到一定尺寸，较大输入需要上下文较长的模型；

图片尺寸不应超过vision_length * 28 ** 2；多图输入时总尺寸也不应超过vision_length * 28 ** 2；

视频的单帧尺寸不应超过vision_length * 28 ** 2；长视频可以分段推理，占用的上下文长度(nframes // 2) * (height // 28) * (width // 28)不应超过模型的seq_length；

若测试发现回答内容重复，可参考文档自行编译bmodel模型，使用llm_convert.py工具时添加参数--do_sample，并且在运行qwen2_5_vl.py时也添加参数--do_sample。

3. 执行录屏

我们提供了执行该sample时的录屏

3.1 SE7录屏

qwen2_5-vl-se7.mp4

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Python例程

目录

1. 环境准备

1.1 x86/arm PCIe平台

1.2 SoC平台

2. 推理测试

2.1 参数说明

2.2 使用方式

3. 执行录屏

3.1 SE7录屏

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Python例程

目录

1. 环境准备

1.1 x86/arm PCIe平台

1.2 SoC平台

2. 推理测试

2.1 参数说明

2.2 使用方式

3. 执行录屏

3.1 SE7录屏