强化学习工具集：实用AI解决方案总汇

CAGrad

多任务学习梯度下降

高效优化多任务学习的梯度冲突

gymnax

gymnax强化学习

JAX驱动的高效强化学习环境集合

mctx

MctxJAX

高效JAX实现的蒙特卡洛树搜索库

jumanji

Jumanji强化学习

JAX驱动的多样化强化学习环境套件加速研究与应用

easy-rl

强化学习蘑菇书

强化学习综合教程从理论到实践

OpenRLHF

OpenRLHFRLHF框架

高性能强化学习框架助力大规模语言模型优化

ViZDoom

ViZDoom强化学习

AI视觉强化学习平台，支持多平台与多语言

machine-learning

machine-learning深度学习

机器学习与数据科学教程，深度学习、模型部署与强化学习

acme

Acme强化学习

强化学习的高效构件库，提供灵活基线

UAV-DDPG

UAV-DDPG无人机

UAV辅助移动边缘计算的深度确定性策略梯度任务优化

ravens

RavensTransporter Networks

PyBullet仿真中的视觉机器人操纵任务集合

irl-imitation

Inverse Reinforcement LearningPython

逆强化学习算法在Python和Tensorflow中的实现

ai_quant_trade

股票AI操盘手强化学习

AI量化交易平台，支持策略学习与实盘操作

agents

TF-AgentsTensorFlow

可靠、可扩展且易于使用的TensorFlow Contextual Bandits和强化学习库

d3rlpy

d3rlpy强化学习

支持离线和在线深度强化学习的实用算法库

bindsnet

BindsNET脉冲神经网络

模拟尖峰神经网络的生物启发机器学习算法

PPO-PyTorch

PPO-PyTorch强化学习

使用PyTorch实现的简易PPO算法工具

rainbow-is-all-you-need

RainbowDQN

从DQN到Rainbow的深度强化学习方法

rllte

RLLTE强化学习

强化学习研究和应用的长期演进项目

maro

MARO资源优化

跨领域资源优化的多代理系统

5 6 7 8 9

探索AI的无限可能

访问

AI工具导航精选AI信息

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com