Themis Preference Pretrained Checkpoints - a project-themis Collection

project-themis 's Collections

Themis Preference Datasets & Benchmarks

Themis Reward Model Collection

Themis Preference Pretrained Checkpoints

Themis Preference Pretrained Checkpoints

updated 28 days ago

A collection of preference model pretraining checkpoints trained on general preference datasets intended as precursors for code reward models.

project-themis/Themis-RM-0.6B-PMP

Text Classification • 0.6B • Updated 22 days ago
project-themis/Themis-RM-1.7B-PMP

Text Classification • 2B • Updated 22 days ago
project-themis/Themis-RM-4B-PMP

Text Classification • 4B • Updated 22 days ago
project-themis/Themis-RM-8B-PMP

Text Classification • 8B • Updated 22 days ago • 64
project-themis/Themis-RM-14B-PMP

Text Classification • 14B • Updated 22 days ago • 64
project-themis/Themis-RM-32B-PMP

Text Classification • 32B • Updated 22 days ago • 67