强化学习工具集:实用AI解决方案总汇

sbx

sbx

Stable Baselines Jax强化学习

Jax加持的Stable-Baselines3强化学习库

rlax

rlax

RLax强化学习

JAX驱动的强化学习算法构建库

android_env

android_env

AndroidEnv强化学习

基于Android的强化学习平台

LLM-Optimizers-Papers

LLM-Optimizers-Papers

LLM优化器

大语言模型作为优化器与自动提示词优化的前沿研究

crafter

crafter

Crafter强化学习

多维度评估AI代理能力的开放世界生存游戏

LIBERO

LIBERO

LIBERO机器人学习

机器人学习知识转移基准平台

flowRL

flowRL

AI工具AI个性化

AI驱动的实时UI个性化平台

FinRL_Podracer

FinRL_Podracer

强化学习量化交易

高效轻量的强化学习量化交易框架

FinRL-Trading

FinRL-Trading

FinRLAI交易

基于机器学习的股票选择与交易策略平台

sheeprl

sheeprl

SheepRL强化学习

基于PyTorch的强化学习框架支持多种算法和环境

RLeXplore

RLeXplore

RLeXplore强化学习

统一模块化工具包助力内在动机强化学习研究

digirl

digirl

DigiRL强化学习

用于训练真实环境设备控制智能体的自主强化学习方法

text2reward

text2reward

Text2Reward强化学习

自动化强化学习奖励函数生成工具

DI-hpc

DI-hpc

DI-HPC强化学习

高性能计算组件加速强化学习算法

awesome-exploration-rl

awesome-exploration-rl

强化学习探索方法

强化学习探索策略全面指南

diffusion_policy

diffusion_policy

Diffusion Policy机器人控制

扩散模型驱动的机器人控制算法实现复杂任务执行

Eureka

Eureka

Eureka强化学习

基于大型语言模型的人类级奖励设计算法

pogema

pogema

POGEMA多智能体寻路

多智能体路径规划的灵活环境平台

leetcode-hard-gym

leetcode-hard-gym

Leetcode-Hard Gym强化学习

用于评估代码生成智能体的LeetCode强化学习环境

tinyzero

tinyzero

AlphaZero强化学习

简易强化学习框架 快速训练类AlphaZero智能体