强化学习工具集:实用AI解决方案总汇

gym-anytrading

gym-anytrading

OpenAI Gym强化学习

基于OpenAI Gym的交易算法模拟环境

BeautifulAlgorithms.jl

BeautifulAlgorithms.jl

Julia算法

Julia语言实现的简洁算法库

PPOxFamily

PPOxFamily

PPO强化学习

PPO算法在决策智能领域的应用实践

Book-Mathematical-Foundation-of-Reinforcement-Learning

Book-Mathematical-Foundation-of-Reinforcement-Learning

强化学习数学基础

强化学习数学基础入门指南

PARL

PARL

PARL强化学习

灵活高效的强化学习开源框架

open_spiel

open_spiel

OpenSpiel强化学习

综合游戏AI研究框架支持多类型博弈

Grounding_LLMs_with_online_RL

Grounding_LLMs_with_online_RL

大语言模型强化学习

GLAM 强化学习优化大型语言模型的新方法

tianshou

tianshou

Tianshou强化学习

基于PyTorch的高性能模块化强化学习框架

lab2d

lab2d

DeepMind Lab2D机器学习

高效灵活的2D网格环境创建工具,专为机器学习研究设计

panda-gym

panda-gym

panda-gym机器人环境

机器人学习环境集,基于PyBullet和gymnasium

humanoid-gym

humanoid-gym

Humanoid-Gym强化学习

人形机器人强化学习框架实现零样本仿真到现实转移

POMDPs.jl

POMDPs.jl

POMDPsMDP

Julia语言的马尔可夫决策过程求解接口

overcooked_ai

overcooked_ai

Overcooked-AI人工智能

基于游戏的多智能体协作研究平台

iris

iris

IRIS世界模型

基于Transformer的高效样本世界模型

dreamerv3

dreamerv3

DreamerV3强化学习

多领域任务的通用强化学习算法

awesome-machine-learning-in-compilers

awesome-machine-learning-in-compilers

机器学习编译器优化

编译器和程序优化中的机器学习资源集锦

3DModelingRL

3DModelingRL

3D建模强化学习

深度强化学习在3D建模中的应用与突破

evotorch

evotorch

EvoTorch进化计算

基于PyTorch的高性能进化计算库

tdmpc2

tdmpc2

TD-MPC2强化学习

跨领域连续控制的可扩展世界模型

rliable

rliable

rliable强化学习

提升强化学习和机器学习评估可靠性的Python库