[rllib] Prevent double calling connectors for `MultiAgentEnvRunner`'s completed episodes when sampling a fixed number of episodes #58931

pseudo-rnd-thoughts · 2025-11-24T10:37:02Z

Description

The MultiAgentEnvRunner would previously call the callback twice for the final episode of a batch (when sampling a fixed number of episodes). This PR fixes this problem ensuring that the callback only happens once for finished episode

Related issues

Closes #55452

… final episode when sampling a fixed number of episodes Signed-off-by: Mark Towers <[email protected]>

Signed-off-by: Mark Towers <[email protected]>

gemini-code-assist

Code Review

This pull request effectively resolves an issue where a connector callback was being invoked twice for the final episode in a batch. The fix is well-implemented by conditionally skipping the on_episode_created callback for the transient, newly created episode that replaces the final completed one. The added test case, which uses a custom EpisodeTracker connector, is a great way to verify the fix and ensure the callback is only triggered once per completed episode. I have one minor suggestion to improve the test code's style.

rllib/env/tests/test_multi_agent_env_runner.py

Signed-off-by: Mark Towers <[email protected]>

Mark Towers added 2 commits November 23, 2025 13:38

[rllib] Prevent double calling connectors for MultiAgentEnvRunner's…

bf890c1

… final episode when sampling a fixed number of episodes Signed-off-by: Mark Towers <[email protected]>

Add test and run pre-commit

6f947ad

Signed-off-by: Mark Towers <[email protected]>

pseudo-rnd-thoughts requested a review from a team as a code owner November 24, 2025 10:37

pseudo-rnd-thoughts mentioned this pull request Nov 24, 2025

[Rllib] MultiAgentEnvRunner in episodes mode calls connectors one time too many. #55452

Open

gemini-code-assist bot reviewed Nov 24, 2025

View reviewed changes

rllib/env/tests/test_multi_agent_env_runner.py Outdated Show resolved Hide resolved

ray-gardener bot added the rllib RLlib related issues label Nov 24, 2025

Cursor code review - assertEquals to assertEqual

a6368a2

Signed-off-by: Mark Towers <[email protected]>

pseudo-rnd-thoughts added the go add ONLY when ready to merge, run all tests label Nov 24, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[rllib] Prevent double calling connectors for `MultiAgentEnvRunner`'s completed episodes when sampling a fixed number of episodes #58931

[rllib] Prevent double calling connectors for `MultiAgentEnvRunner`'s completed episodes when sampling a fixed number of episodes #58931

pseudo-rnd-thoughts commented Nov 24, 2025

Uh oh!

gemini-code-assist bot left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

[rllib] Prevent double calling connectors for MultiAgentEnvRunner's completed episodes when sampling a fixed number of episodes #58931

Are you sure you want to change the base?

[rllib] Prevent double calling connectors for MultiAgentEnvRunner's completed episodes when sampling a fixed number of episodes #58931

Conversation

pseudo-rnd-thoughts commented Nov 24, 2025

Description

Related issues

Uh oh!

gemini-code-assist bot left a comment

Choose a reason for hiding this comment

Code Review

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

[rllib] Prevent double calling connectors for `MultiAgentEnvRunner`'s completed episodes when sampling a fixed number of episodes #58931

[rllib] Prevent double calling connectors for `MultiAgentEnvRunner`'s completed episodes when sampling a fixed number of episodes #58931