reinforcement_learning_research - a zombieofCrypto Collection

zombieofCrypto 's Collections

reinforcement_learning_research

llm_improvement_research

audio recognition

timeseriesforecasting

reinforcement_learning_research

updated Oct 5, 2025

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17, 2025 • 45
Parallel-R1: Towards Parallel Thinking via Reinforcement Learning

Paper • 2509.07980 • Published Sep 9, 2025 • 101