14 24 6

Gaotang Li

gaotang

https://gaotangli.github.io/

GaotangLi

AI & ML interests

None yet

Recent Activity

updated a dataset 27 days ago

gaotang/knowledge_memorization_openbookqa

published a dataset 27 days ago

gaotang/knowledge_memorization_openbookqa

updated a dataset 27 days ago

gaotang/mix_magpie_evol_instruct_140k

View all activity

Organizations

None yet

updated a dataset 27 days ago

gaotang/knowledge_memorization_openbookqa

Updated 27 days ago • 40

published a dataset 27 days ago

gaotang/knowledge_memorization_openbookqa

Updated 27 days ago • 40

updated a dataset 27 days ago

gaotang/mix_magpie_evol_instruct_140k

Viewer • Updated 27 days ago • 140k • 44

published a dataset 27 days ago

gaotang/mix_magpie_evol_instruct_140k

Viewer • Updated 27 days ago • 140k • 44

updated a collection 27 days ago

Beyond-Log-Likelihood

Collection

6 items • Updated 27 days ago • 2

updated a dataset 27 days ago

gaotang/coder_sft

Viewer • Updated 27 days ago • 75.5k • 51

published a dataset 27 days ago

gaotang/coder_sft

Viewer • Updated 27 days ago • 75.5k • 51

updated a dataset 27 days ago

gaotang/low_resource_language

Updated 27 days ago • 41

published a dataset 27 days ago

gaotang/low_resource_language

Updated 27 days ago • 41

commented a paper about 1 month ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published May 11 • 79 •

upvoted a paper about 1 month ago

Code as Agent Harness

Paper • 2605.18747 • Published May 18 • 223

authored a paper about 1 month ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published May 11 • 79

upvoted 3 papers about 1 month ago

Useful Memories Become Faulty When Continuously Updated by LLMs

Paper • 2605.12978 • Published May 13 • 19

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Paper • 2605.05242 • Published May 3 • 126

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published May 11 • 79

submitted a paper to Daily Papers about 1 month ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published May 11 • 79

upvoted 2 papers about 2 months ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published Apr 30 • 222

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published Apr 28 • 286

liked a dataset 2 months ago

YennNing/MC-Search

Viewer • Updated Feb 22 • 3.33k • 351 • 28

Gaotang Li

AI & ML interests

Recent Activity

Organizations

gaotang's activity