正式推出

TRL 正式推出，来训练你的首个 RLHF 模型吧！

我们正式向大家介绍 TRL——Transformer Reinforcement Learning。这是一个超全面的全栈库，包含了一整套工具用于使用强化学习 (Reinforcement Learning) 训练 transformer 语言模型。从监督调优 (Supervised Fine...
2023-08-11编程代码模型,正式推出,首个