payelb
/

aligned_llama32_1b_ultrafeedback_fixed1k_won

Model card Files Files and versions

aligned_llama32_1b_ultrafeedback_fixed1k_won

2.49 GB

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

payelb's picture

Add PPO value head weights (value_head.pt)

a40b4f8 verified 3 months ago