强化学习工具集:实用AI解决方案总汇

flashbax

flashbax

Flashbax经验回放缓冲区

JAX强化学习高效体验回放缓冲库

rsl_rl

rsl_rl

RSL RL强化学习

面向GPU的高效强化学习框架

PPO-for-Beginners

PPO-for-Beginners

PPO强化学习

PyTorch实现近端策略优化算法详解

DI-star

DI-star

StarCraft IIAI

开源星际争霸II AI训练框架

DI-engine-docs

DI-engine-docs

DI-engine决策智能

全面的决策智能和强化学习开源教育平台

awesome-model-based-RL

awesome-model-based-RL

强化学习模型学习

模型化强化学习论文与资源汇总

awesome-diffusion-model-in-rl

awesome-diffusion-model-in-rl

Diffusion Model强化学习

扩散模型在强化学习领域的最新研究进展汇总

awesome-decision-transformer

awesome-decision-transformer

Decision Transformer强化学习

基于序列模型的离线强化学习新方法

omnisafe

omnisafe

SafeRLOmniSafe

安全强化学习框架加速AI系统安全研究

envpool

envpool

EnvPool强化学习

高性能并行强化学习环境执行引擎

lerobot

lerobot

LeRobot机器人

实用机器学习库助力实际机器人开发

trl

trl

TRL微调

用于大型语言模型微调和对齐的开源工具库

financial-machine-learning

financial-machine-learning

金融机器学习算法交易

金融机器学习资源汇总与实践指南

HEBO

HEBO

贝叶斯优化强化学习

华为开源贝叶斯优化与强化学习研究框架

Minigrid

Minigrid

Minigrid强化学习

离散网格世界强化学习环境库 支持多样化任务和语言指令

Miniworld

Miniworld

Miniworld强化学习

轻量级3D室内环境模拟器 强化学习与机器人研究利器

motif

motif

MotifAI

利用大语言模型偏好生成奖励函数的强化学习框架

hands-on-rl

hands-on-rl

强化学习课程

实践驱动的强化学习进阶教程

DRLX

DRLX

DRLX扩散模型

强化学习框架优化扩散模型

Gymnasium

Gymnasium

Gymnasium强化学习

Python强化学习标准API和环境开源库