强化学习工具集:实用AI解决方案总汇

CAGrad

CAGrad

多任务学习梯度下降

高效优化多任务学习的梯度冲突

gymnax

gymnax

gymnax强化学习

JAX驱动的高效强化学习环境集合

mctx

mctx

MctxJAX

高效JAX实现的蒙特卡洛树搜索库

jumanji

jumanji

Jumanji强化学习

JAX驱动的多样化强化学习环境套件 加速研究与应用

easy-rl

easy-rl

强化学习蘑菇书

强化学习综合教程 从理论到实践

OpenRLHF

OpenRLHF

OpenRLHFRLHF框架

高性能强化学习框架助力大规模语言模型优化

ViZDoom

ViZDoom

ViZDoom强化学习

AI视觉强化学习平台,支持多平台与多语言

machine-learning

machine-learning

machine-learning深度学习

机器学习与数据科学教程,深度学习、模型部署与强化学习

acme

acme

Acme强化学习

强化学习的高效构件库,提供灵活基线

UAV-DDPG

UAV-DDPG

UAV-DDPG无人机

UAV辅助移动边缘计算的深度确定性策略梯度任务优化

ravens

ravens

RavensTransporter Networks

PyBullet仿真中的视觉机器人操纵任务集合

irl-imitation

irl-imitation

Inverse Reinforcement LearningPython

逆强化学习算法在Python和Tensorflow中的实现

ai_quant_trade

ai_quant_trade

股票AI操盘手强化学习

AI量化交易平台,支持策略学习与实盘操作

agents

agents

TF-AgentsTensorFlow

可靠、可扩展且易于使用的TensorFlow Contextual Bandits和强化学习库

d3rlpy

d3rlpy

d3rlpy强化学习

支持离线和在线深度强化学习的实用算法库

bindsnet

bindsnet

BindsNET脉冲神经网络

模拟尖峰神经网络的生物启发机器学习算法

PPO-PyTorch

PPO-PyTorch

PPO-PyTorch强化学习

使用PyTorch实现的简易PPO算法工具

rainbow-is-all-you-need

rainbow-is-all-you-need

RainbowDQN

从DQN到Rainbow的深度强化学习方法

rllte

rllte

RLLTE强化学习

强化学习研究和应用的长期演进项目

maro

maro

MARO资源优化

跨领域资源优化的多代理系统