Transformer 从4.57.3 升级到5.3.0 后过滤数据时长变慢十倍以上

### System Info

H20 

### Who can help?

_No response_

### Information

- [ ] The official example scripts
- [x] My own modified scripts

### Tasks

- [ ] An officially supported task in the `examples` folder (such as GLUE/SQuAD, ...)
- [x] My own task or dataset (give details below)

### Reproduction

过滤函数实现：对应链接 https://github.com/verl-project/verl/blob/main/verl/utils/dataset/rl_dataset.py#L241
```
          def doc2len(doc) -> int:
                    try:
                        apply_kwargs = dict(**self.apply_chat_template_kwargs)
                        if self.tool_schemas is not None:
                            apply_kwargs["tools"] = self.tool_schemas

                        # Keep explicit tokenization to avoid transformers version default changes.
                        apply_kwargs.pop("tokenize", None)
                        apply_kwargs.pop("return_dict", None)
                        apply_kwargs.pop("return_tensors", None)

                        tokenized_prompt = tokenizer.apply_chat_template(
                            doc[prompt_key], add_generation_prompt=True, tokenize=True, **apply_kwargs
                        )
                        return len(normalize_token_ids(tokenized_prompt))
                    except Exception:
                        print("Error processing one of the samples, skipping...")
                        traceback.print_exc()
                        return self.max_prompt_length + 1

            dataframe = dataframe.filter(
                lambda doc: doc2len(doc) <= self.max_prompt_length,
                num_proc=self.num_workers,
                desc=f"Filtering prompts longer than {self.max_prompt_length} tokens",
            )
```
使用transformer 4.57.3 运行这段code大概十几分钟，如果升级到5.3.0 需要约两个小时；辛苦帮忙看看 模型=qwen3.5-35b-A22 数据集是aime-2024 
4.57.3 结果
<img width="1818" height="300" alt="Image" src="https://github.com/user-attachments/assets/df875792-23ae-4efe-9f42-c11de9516e5a" />
5.3.0 结果
<img width="1506" height="236" alt="Image" src="https://github.com/user-attachments/assets/d2b7f182-0337-4cb0-a32e-d34cfd78f43a" />


### Expected behavior

希望transformer 升级后，其tokenizer 的速度没有变化

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Transformer 从4.57.3 升级到5.3.0 后过滤数据时长变慢十倍以上 #44749

System Info

Who can help?

Information

Tasks

Reproduction

Expected behavior

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Transformer 从4.57.3 升级到5.3.0 后过滤数据时长变慢十倍以上 #44749

Description

System Info

Who can help?

Information

Tasks

Reproduction

Expected behavior

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions