Haolin Liu's picture

18

Haolin Liu

lhl616

AI & ML interests

None yet

Recent Activity

upvoted a paper about 5 hours ago

Training Data Efficiency in Multimodal Process Reward Models

upvoted a paper 1 day ago

Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing

upvoted a paper 27 days ago

RelayLLM: Efficient Reasoning via Collaborative Decoding

View all activity

Organizations

None yet

upvoted a paper about 5 hours ago

Training Data Efficiency in Multimodal Process Reward Models

Paper • 2602.04145 • Published 1 day ago • 56

upvoted a paper 1 day ago

Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing

Paper • 2602.03845 • Published 1 day ago • 23

upvoted a paper 27 days ago

RelayLLM: Efficient Reasoning via Collaborative Decoding

Paper • 2601.05167 • Published 28 days ago • 29

upvoted a paper 28 days ago

Benchmark^2: Systematic Evaluation of LLM Benchmarks

Paper • 2601.03986 • Published 29 days ago • 34

upvoted 2 papers about 2 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

Paper • 2512.15687 • Published Dec 17, 2025 • 20

MotionEdit: Benchmarking and Learning Motion-Centric Image Editing

Paper • 2512.10284 • Published Dec 11, 2025 • 26

updated a model 2 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-ratio

8B • Updated Nov 29, 2025

published a model 2 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-ratio

8B • Updated Nov 29, 2025

updated a model 2 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-mixed

8B • Updated Nov 29, 2025

published a model 2 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-mixed

8B • Updated Nov 29, 2025

updated a model 2 months ago

lhl616/Qwen3-8B-Base-axon-ppo

8B • Updated Nov 29, 2025

published a model 2 months ago

lhl616/Qwen3-8B-Base-axon-ppo

8B • Updated Nov 29, 2025

updated a model 2 months ago

lhl616/Qwen3-8B-Base-axon-grpo-step-128-8

8B • Updated Nov 29, 2025

published a model 2 months ago

lhl616/Qwen3-8B-Base-axon-grpo-step-128-8

8B • Updated Nov 29, 2025

updated a model 2 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-ratio-new

8B • Updated Nov 29, 2025

published a model 2 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-ratio-new

8B • Updated Nov 29, 2025

updated a model 2 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-passk

8B • Updated Nov 29, 2025

published a model 2 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-passk

8B • Updated Nov 29, 2025

updated a model 2 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-nstd-0.5-0.8-step-2

8B • Updated Nov 29, 2025

published a model 2 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-nstd-0.5-0.8-step-2

8B • Updated Nov 29, 2025