Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

reward-modeling

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

5

Full-text search

Active filters: reward-modeling

LifelongAlignment/aifgen-piecewise-preference-shift-0-reward-model

Reinforcement Learning • 0.5B • Updated May 7, 2025 • 6

opencompass/CompassJudger-2-32B-Instruct

Text Ranking • 33B • Updated Jul 22, 2025 • 108 • 2

mradermacher/CompassJudger-2-32B-Instruct-GGUF

Text Ranking • 33B • Updated Jul 23, 2025 • 81

mradermacher/CompassJudger-2-32B-Instruct-i1-GGUF

Text Ranking • 33B • Updated Jul 23, 2025 • 215

htaf/distill-pipeline

Updated Nov 27, 2025