nvidia-cosmos/cosmos-rl

Milestones

More models support
Support more customized models; Support and optimize more automatic parallelism for HF model usage.
Due by December 31, 2025
•1/2 issues closed
50% complete1 open 1 closed
Training convergence verification and optimization
Verify training convergence at various tasks and settings; Match or enhance the convergence compared to other frameworks; Start from on-policy mode to async mode; New techniques to enhance training convergence for async mode.
Due by December 31, 2025
•2/3 issues closed
66% complete1 open 2 closed
Memory consumption analysis and optimization
Analyze memory consumption saving under various optimization techniques; Compare memory consumption with other frameworks like Verl; More memory optimization techniques; Enable efficient long token training.
Due by December 31, 2025
•1/3 issues closed
33% complete2 open 1 closed