Yihang

YYY-45

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

RLAnything: Forge Environment, Policy, and Reward Model in Completely Dynamic RL System

upvoted a paper 19 days ago

Webscale-RL: Automated Data Pipeline for Scaling RL Data to Pretraining Levels

liked a dataset about 2 months ago

NEU-HAI/OPeRA

View all activity

Organizations

upvoted a paper 1 day ago

RLAnything: Forge Environment, Policy, and Reward Model in Completely Dynamic RL System

Paper • 2602.02488 • Published 3 days ago • 29

upvoted a paper 19 days ago

Webscale-RL: Automated Data Pipeline for Scaling RL Data to Pretraining Levels

Paper • 2510.06499 • Published Oct 7, 2025 • 33

liked a dataset about 2 months ago

NEU-HAI/OPeRA

Viewer • Updated Dec 6, 2025 • 53.3k • 244 • 8

liked a dataset 3 months ago

facebook/collaborative_agent_bench

Preview • Updated Mar 20, 2025 • 97 • 59

updated a dataset 3 months ago

YYY-45/DSRL

Updated Nov 12, 2025 • 93

liked a dataset 3 months ago

facebook/natural_reasoning

Viewer • Updated Feb 21, 2025 • 1.15M • 1.56k • 550

published a dataset 3 months ago

YYY-45/DSRL

Updated Nov 12, 2025 • 93

upvoted a paper 3 months ago

MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning

Paper • 2505.24871 • Published May 30, 2025 • 23

liked 2 datasets 4 months ago

Salesforce/Webscale-RL

Viewer • Updated Oct 14, 2025 • 1.11M • 391 • 81

YuyouZhang/SpinBench

Updated Oct 5, 2025 • 76 • 3

liked a model 5 months ago

nvidia/NV-Embed-v2

Feature Extraction • 8B • Updated Jul 21, 2025 • 56.8k • 502

updated a dataset 5 months ago

YYY-45/dsrl_old

Updated Sep 15, 2025 • 1

published a dataset 5 months ago

YYY-45/dsrl_old

Updated Sep 15, 2025 • 1

liked a dataset 8 months ago

Salesforce/APIGen-MT-5k

Viewer • Updated Oct 10, 2025 • 5k • 354 • 89

upvoted a paper 8 months ago

Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering

Paper • 2505.23604 • Published May 29, 2025 • 23

liked 2 datasets 9 months ago

ByteDance-Seed/Multi-SWE-RL

Updated Jul 23, 2025 • 1.32k • 32

SWE-bench/SWE-smith-trajectories

Viewer • Updated Jul 19, 2025 • 76k • 1.51k • 47

liked 2 datasets 10 months ago

hkust-nlp/GUIMid

Viewer • Updated May 3, 2025 • 1.85M • 205 • 6

Aria-UI/Aria-UI_Data

Updated Mar 3, 2025 • 958 • 35

updated a model 12 months ago

YYY-45/OASIS

Updated Feb 12, 2025 • 1

Yihang

AI & ML interests

Recent Activity

Organizations

YYY-45's activity