Gen-Verse/ReasonFlux — project offers a suite of advanced algorithms for post-

Version	Commit	Size	Downloads	Date
latestLatest	HEAD	17.7 MB	0	13d ago

🧠 ReasonFlux Series

Advanced Open-Source LLM Post-Training Suite

Princeton University & PKU & UIUC & University of Chicago & ByteDance Seed

🎯 Mission: Building next-generation reasoning capabilities through innovative LLM post-training algorithms focusing on data selection, reinforcement learning, and inference scaling.

Contents of Repository

Updates
Model Family Guide
Performance Hightlights
Citation

🚀 What Makes ReasonFlux Series Special?

1. Trajectory-Aware Process Reward Models for Long-CoT Reasoning (ReasonFlux-PRM, NeurIPS 2025)

Trajectory-aware reward models that provide dense supervision for both offline data selection and online policy optimization in long-CoT reasoning.

Repository image

2. Co-Evolved RL for LLM Coder and Unit Tester (ReasonFlux-Coder, NeurIPS 2025 Spotlight)

Innovative approach where coders and unit testers evolve together through reinforcement learning, creating more robust coding capabilities.

Repository image

ReasonFlux

Quick Overview

What is this?

What problem does it solve?

Who should use it?

Pros

Cons

Scores

Trust Score

Maintenance

Popularity

Star History

Snapshot Versions

Alternatives

claude-mem

Front-End-Checklist

learn-claude-code

ruflo

gpt-engineer

career-ops

Community Reviews