shawnxzhu (shawnxzhu)

Collections 1

models 4

datasets 10

shawnxzhu/DSAA6000Q-Mistral-7B-Instruct-v0.2-lima-dpo

Viewer • Updated May 11, 2025 • 1.03k • 2

shawnxzhu/CHARM-preference20K

Viewer • Updated Apr 12, 2025 • 20k • 2

shawnxzhu/CHARM-preference20K-Qwen2.5-72B-Instruct

Viewer • Updated Apr 12, 2025 • 20k • 2

shawnxzhu/CHARM-preference20K-Llama-3.1-70B-Instruct

Viewer • Updated Apr 12, 2025 • 20k • 2

shawnxzhu/CHARM-preference20K-Llama-3.1-8B-Instruct

Viewer • Updated Apr 12, 2025 • 20k • 2

shawnxzhu/CHARM-preference20K-GPT-4o-mini-2024-07-18

Viewer • Updated Apr 12, 2025 • 20k • 4

shawnxzhu/CHARM-preference20K-gemma-2-27b-it

Viewer • Updated Apr 12, 2025 • 20k • 1

shawnxzhu/CHARM-preference20K-gemma-2-9b-it

Viewer • Updated Apr 12, 2025 • 20k • 4

shawnxzhu/CHARM-preference20K-gemma-2-9b-it-SimPO

Viewer • Updated Apr 12, 2025 • 20k • 4

shawnxzhu/backward-curation

Preview • Updated Apr 8, 2025

shawnxzhu

AI & ML interests

Organizations

Collections 1

shawnxzhu/CHARM-calibrated-Skywork-Reward-Llama-3.1-8B-v0.2

shawnxzhu/CHARM-calibrated-Skywork-Reward-Llama-3.1-8B-v0.2

models 4

shawnxzhu/cdgpt-1b

shawnxzhu/CHARM-calibrated-Skywork-Reward-Llama-3.1-8B-v0.2

shawnxzhu/Llama-2-7b-hf-backward-finetuned

shawnxzhu/Llama-2-7b-hf-backward

datasets 10

shawnxzhu/DSAA6000Q-Mistral-7B-Instruct-v0.2-lima-dpo

shawnxzhu/CHARM-preference20K

shawnxzhu/CHARM-preference20K-Qwen2.5-72B-Instruct

shawnxzhu/CHARM-preference20K-Llama-3.1-70B-Instruct

shawnxzhu/CHARM-preference20K-Llama-3.1-8B-Instruct

shawnxzhu/CHARM-preference20K-GPT-4o-mini-2024-07-18

shawnxzhu/CHARM-preference20K-gemma-2-27b-it

shawnxzhu/CHARM-preference20K-gemma-2-9b-it

shawnxzhu/CHARM-preference20K-gemma-2-9b-it-SimPO

shawnxzhu/backward-curation

shawnxzhu

AI & ML interests

Organizations

Collections 1

models 4 Sort: Recently updated

datasets 10 Sort: Recently updated

models 4

datasets 10