laion
/

rl__24GPU_base__swe_rebench_patched_oracle__r2egym-nl2bash-stack

Model card Files Files and versions

rl__24GPU_base__swe_rebench_patched_oracle__r2egym-nl2bash-stack

RL-trained Qwen3-8B (81 steps, GRPO/RLOO-N)

Base: Qwen/Qwen3-8B
W&B: https://wandb.ai/dogml/OpenThoughts-Agent/runs/lptlutqj

Downloads last month: 43

Safetensors

Model size

8B params

Tensor type

BF16

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support