slime

slime 是为 RL scaling 设计的 LLM post‑training 框架，提供两大核心能力：

架构总览

模块说明：

有关环境配置、数据准备、训练启动和关键代码分析的完整快速开始指南，请参考：

我还还额外提供了一些使用样例，请参考样例目录：examples。

参数分为三类：

megatron 参数：slime 会读取 PYTHONPATH 中的 megatron 里设置的所有参数，可以通过传入如 --tensor-model-parallel-size 2 的方式配置 megatron；
sglang 参数：支持环境中安装的 sglang 的所有参数，这些参数需要以 --sglang 起始，例如 --mem-fraction-static 需要通过 --sglang-mem-fraction-static 传入。
slime 自身的参数：请见：slime/utils/arguments.py

完整使用说明请查阅使用文档。

使用 pre-commit 保证提交代码风格：

apt install pre-commit -y
pre-commit install