cavities12

ellen ma cavities12

Achievements

KempnerInstitute/AgentsOpenRLHF KempnerInstitute/AgentsOpenRLHF Public

Forked from OpenRLHF/OpenRLHF

An Easy-to-use, Scalable and High-performance RLHF Framework based on Ray (PPO & GRPO & REINFORCE++ & vLLM & Ray & Dynamic Sampling & Async Agentic RL)

Python 1
multiturn-rl-agent multiturn-rl-agent Public

Multi-turn RL agents with simulation-based planning compatible with OpenRLHF

Python