UbeCc

Follow

Haoran Wang UbeCc

Follow

I am not a beast of burden. I am a LLaMA! 不是牛马是拉马（我不是奶龙）

99 followers · 99 following

Tsinghua University
Beijing, China
12:26 (UTC +08:00)
ubecwang@gmail.com
@UbecWang
https://ubecc.github.io/

Achievements

Achievements

Highlights

Pro

Organizations

Pinned Loading

THUDM/slime THUDM/slime Public

slime is an LLM post-training framework for RL Scaling.

Python 6.1k 895
OpenRLHF/OpenRLHF OpenRLHF/OpenRLHF Public

An Easy-to-use, Scalable and High-performance Agentic RL Framework based on Ray (PPO & DAPO & REINFORCE++ & VLM & TIS & vLLM & Ray & Async RL)

Python 9.6k 969
THUDM/SWE-Dev THUDM/SWE-Dev Public

[ACL25' Findings] SWE-Dev is an SWE agent with a scalable test case construction pipeline.

Python 60
Generalization-of-Transformers Generalization-of-Transformers Public

[ICLR'25] Understanding the Generalization of In-Context Learning in Transformers: An Empirical Study

Python 4