Kcz/add mp4 spliting into frames by krzyczar · Pull Request #3 · xipingyan/openvino.genai

krzyczar · 2025-10-08T14:03:06Z

Description

Ticket:

Fixes #(issue)

Checklist:

Tests have been updated or added to cover the new code
This patch fully addresses the ticket.
I have made corresponding changes to the documentation

Signed-off-by: xipingya <xiping.yan@intel.com>

Only calc once for video process. Signed-off-by: xipingya <xiping.yan@intel.com>

Signed-off-by: xipingya <xiping.yan@intel.com>

2: add ov::Properity::video Signed-off-by: xipingya <xiping.yan@intel.com>

Co-authored-by: Wanglei Shen <wanglei.shen@intel.com>

# Conflicts: # src/cpp/src/continuous_batching/pipeline_base.cpp # src/cpp/src/visual_language/inputs_embedder.cpp # src/cpp/src/visual_language/inputs_embedder.hpp # src/cpp/src/visual_language/qwen2vl/classes.cpp # src/cpp/src/visual_language/qwen2vl/classes.hpp

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

…om/xipingyan/openvino.genai into xp/enable_qwen_vl_video_preprocess

Signed-off-by: xipingya <xiping.yan@intel.com>

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Signed-off-by: xipingya <xiping.yan@intel.com>

Add "video" to continues batching. Signed-off-by: xipingya <xiping.yan@intel.com>

Signed-off-by: xipingya <xiping.yan@intel.com>

2:Add: mix video+image inputs. Signed-off-by: xiping.yan <xiping.yan@intel.com>

<video_pad> + <image_pad>, so put video to ahead of image. keep align with genai. Signed-off-by: xiping.yan <xiping.yan@intel.com>

2: Split video and image process. 3: Fix copy embed feature bug. Signed-off-by: xipingya <xiping.yan@intel.com>

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

wrapper calculate_product Signed-off-by: xiping.yan <xiping.yan@intel.com>

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Signed-off-by: xipingya <xiping.yan@intel.com>

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Signed-off-by: xiping.yan <xiping.yan@intel.com>

sbalandi · 2025-10-24T15:08:32Z

fyi @Wovchena

Wovchena · 2025-10-24T15:29:57Z

tools/llm_bench/task/visual_language_generation.py

+        if input_data.get("video", None):
+            entry = Path(input_data["video"])
+            ordered_frames = pu.split_video_into_frames(entry, required_frames)
+            images.extend(ordered_frames)


That indeed interprets a video as images. Just like the title says. But GenAI started supporting video input as a separate entity. What's the reason to split the video into frames?

Ok I will fix it

sbalandi · 2025-10-24T17:17:31Z

tools/llm_bench/task/visual_language_generation.py

-        gen_fn = run_visual_language_generation_optimum
-    else:
-        gen_fn = run_visual_language_generation_genai
+    if use_genai: gen_fn = run_visual_language_generation_genai


please, use ternary operator or keep previous variant, multiline code is more readable

sbalandi · 2025-10-24T17:21:40Z

tools/llm_bench/llm_bench_utils/parse_json_data.py

-        else:
-            raise RuntimeError('== key word "prompt" does not exist ==')
+        prompt_data = create_base_prompt(json_data)
+        assert ("media" in json_data) ^ ("video" in json_data)


please, add message fo assert, but its better to use raise RuntimeError

sbalandi · 2025-10-24T17:25:54Z

tools/llm_bench/task/visual_language_generation.py

-                if args['prompt_file'] is not None and len(args['prompt_file']) > 0:
-                    vlm_file['media'] = model_utils.resolve_media_file_path(vlm_file.get("media"), args['prompt_file'][0])
+                if args['prompt_file'] is not None and len(args['prompt_file']) > 0 and 'media' in vlm_file:
+                    if 'video' in vlm_file: log.warning('media and video cannot be specify in a single prompt file')


we have warning here, but assert above, let's rise exeption in both cases

xipingyan and others added 30 commits August 11, 2025 09:31

Avoid to do resize for same width and height images.

6c49dc8

Signed-off-by: xipingya <xiping.yan@intel.com>

Enable video process for qwen*-vl

c7d9932

Signed-off-by: xipingya <xiping.yan@intel.com>

Add python interface: generate config: is_video, default false.

2ee043f

Signed-off-by: xipingya <xiping.yan@intel.com>

fallback video_encode to image encode in base class.

29c74fd

Signed-off-by: xipingya <xiping.yan@intel.com>

Update calc target image size.

78dac29

Only calc once for video process. Signed-off-by: xipingya <xiping.yan@intel.com>

Reduce shared codes, fallback to image process via return empty vector;

7b2c115

Signed-off-by: xipingya <xiping.yan@intel.com>

1: remove is_video,

10d8e8d

2: add ov::Properity::video Signed-off-by: xipingya <xiping.yan@intel.com>

Update src/cpp/src/visual_language/llava/classes.cpp

a3000d4

Co-authored-by: Wanglei Shen <wanglei.shen@intel.com>

Update src/cpp/src/visual_language/pipeline.cpp

4d8375d

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

rename according to copilot suggestion

ef9f868

Merge branch 'xp/enable_qwen_vl_video_preprocess' of https://github.c…

ad95828

…om/xipingyan/openvino.genai into xp/enable_qwen_vl_video_preprocess

rename rgbs to images

f92b19b

Signed-off-by: xipingya <xiping.yan@intel.com>

enable if node to unify image and video preprocess.

66cdf38

Signed-off-by: xipingya <xiping.yan@intel.com>

cpp preprocess: enable video preprecess.

3eda036

Signed-off-by: xipingya <xiping.yan@intel.com>

Pass same_images

3df267f

Signed-off-by: xipingya <xiping.yan@intel.com>

add commments for same image

bf3169b

Update loop condition, and rename variables.

e1250aa

Signed-off-by: xipingya <xiping.yan@intel.com>

Update src/cpp/src/visual_language/pipeline_base.hpp

fe0ab92

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

video should be frames.

dec67b2

Signed-off-by: xipingya <xiping.yan@intel.com>

Add pytest for video input.

caee3fd

Signed-off-by: xipingya <xiping.yan@intel.com>

Merge branch 'master' into xp/enable_qwen_vl_video_preprocess

6a49a48

Merge branch 'master' into xp/enable_qwen_vl_video_preprocess

800638e

Remove is_video python attribute.

1502b28

Add "video" to continues batching. Signed-off-by: xipingya <xiping.yan@intel.com>

rename video to videos

4d8e867

Update docs, and add video for add_request.

ea7fc94

Signed-off-by: xipingya <xiping.yan@intel.com>

Fix docs format.

60364bf

Signed-off-by: xipingya <xiping.yan@intel.com>

Fix test error: can't catch exception.

4ea5b3d

Signed-off-by: xipingya <xiping.yan@intel.com>

Fix: cannot be narrowed from type 'int' to 'float' in initializer list

8a0ab2e

Signed-off-by: xipingya <xiping.yan@intel.com>

Support no image or video input;

28337ea

Signed-off-by: xipingya <xiping.yan@intel.com>

xipingyan and others added 24 commits October 16, 2025 09:54

1:Remove python depends

1524c56

2:Add: mix video+image inputs. Signed-off-by: xiping.yan <xiping.yan@intel.com>

Merge branch 'master' into xp/enable_qwen_vl_video_preprocess

3b5ecf9

video and image order of QWen2.5-VL's implatmenation:

c877d9a

<video_pad> + <image_pad>, so put video to ahead of image. keep align with genai. Signed-off-by: xiping.yan <xiping.yan@intel.com>

1: Remove video_frames_features, reuse video_feautures;

2994330

2: Split video and image process. 3: Fix copy embed feature bug. Signed-off-by: xipingya <xiping.yan@intel.com>

Update get_window_index after split video and image processing.

5e00877

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Merge branch 'master' into xp/enable_qwen_vl_video_preprocess

2be9349

Fix ci issue after merging master.

00a32ba

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Fix cmake error: arithmetic on a pointer to void

d73a110

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Keep align naming for video_embed_idx and image_embed_idx

ce13b59

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Video should be put to ahead of image in GenAI implementation.

3220562

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Update tests/python_tests/test_vlm_pipeline.py

c476670

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Update src/cpp/src/visual_language/qwen2vl/classes.cpp

db74b11

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Update src/cpp/src/visual_language/qwen2vl/classes.cpp

1cc533c

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Update src/cpp/src/visual_language/qwen2vl/classes.cpp

1acd4e6

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Update src/cpp/src/visual_language/qwen2vl/classes.cpp

946834c

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Fix spelling error.

c9bdc89

wrapper calculate_product Signed-off-by: xiping.yan <xiping.yan@intel.com>

Update src/cpp/src/visual_language/qwen2vl/classes.cpp

9ac9fa1

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Fix void* cast issue.

44c8193

Signed-off-by: xiping.yan <xiping.yan@intel.com>

Fix calc product bug when input is empty.

e660021

Signed-off-by: xiping.yan <xiping.yan@intel.com>

reserve image_pad_token number for better performance.

27aa591

Signed-off-by: xipingya <xiping.yan@intel.com>

Update src/cpp/src/visual_language/qwen2vl/classes.cpp

b400a64

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Update src/cpp/src/visual_language/qwen2_5_vl/classes.cpp

03e4b9e

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

Removed the duplicated parts.

2091bb9

Signed-off-by: xiping.yan <xiping.yan@intel.com>

kcz/add_mp4_disabling_into_frames

4f2bf4b

Wovchena reviewed Oct 24, 2025

View reviewed changes

sbalandi reviewed Oct 24, 2025

View reviewed changes

after Sofya's review

dbf9d69

krzyczar changed the base branch from xp/enable_qwen_vl_video_preprocess to master November 6, 2025 09:26

krzyczar closed this by deleting the head repository Nov 6, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Kcz/add mp4 spliting into frames#3

Kcz/add mp4 spliting into frames#3
krzyczar wants to merge 135 commits intoxipingyan:masterfrom
krzyczar:kcz/add_mp4_disabling_into_frames

krzyczar commented Oct 8, 2025

Uh oh!

sbalandi commented Oct 24, 2025

Uh oh!

Wovchena Oct 24, 2025

Uh oh!

krzyczar Nov 6, 2025

Uh oh!

sbalandi Oct 24, 2025

Uh oh!

krzyczar Nov 6, 2025

Uh oh!

sbalandi Oct 24, 2025

Uh oh!

sbalandi Oct 24, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

Conversation

krzyczar commented Oct 8, 2025

Description

Checklist:

Uh oh!

sbalandi commented Oct 24, 2025

Uh oh!

Wovchena Oct 24, 2025

Choose a reason for hiding this comment

Uh oh!

krzyczar Nov 6, 2025

Choose a reason for hiding this comment

Uh oh!

sbalandi Oct 24, 2025

Choose a reason for hiding this comment

Uh oh!

krzyczar Nov 6, 2025

Choose a reason for hiding this comment

Uh oh!

sbalandi Oct 24, 2025

Choose a reason for hiding this comment

Uh oh!

sbalandi Oct 24, 2025

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants