qgallouedec
/

Qwen2-0.5B-Reward-Math-Sheperd-KN-fix-cast

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-Reward-Math-Sheperd-KN-fix-cast / training_args.bin

Commit History

Training in progress, step 500

b276db4
verified

qgallouedec HF Staff commited on Dec 9, 2024