强化学习工具集:实用AI解决方案总汇

OpenRL学习资料汇总 - 统一的强化学习框架

OpenRL学习资料汇总 - 统一的强化学习框架

本文汇总了OpenRL项目的各种学习资源,包括官方文档、教程、示例代码等,旨在帮助读者快速入门和深入学习这个强大的强化学习框架。

OpenRL强化学习PyTorch多智能体自然语言处理Github开源项目
rl-baselines-zoo学习资料汇总 - 强化学习预训练模型集合与训练框架

rl-baselines-zoo学习资料汇总 - 强化学习预训练模型集合与训练框架

rl-baselines-zoo是一个强化学习预训练模型集合和训练框架,提供了100多个使用Stable Baselines训练的RL智能体,包括训练脚本和超参数优化功能。

强化学习训练代理Stable-Baselines3RL Baselines Zoo超参数调优Github开源项目
MedicalGPT入门指南-基于ChatGPT训练Pipeline的医疗大模型训练框架

MedicalGPT入门指南-基于ChatGPT训练Pipeline的医疗大模型训练框架

MedicalGPT是一个基于ChatGPT训练Pipeline的医疗大模型训练框架,实现了包括增量预训练、有监督微调、RLHF、DPO等多种训练方法,可用于训练领域特定的大语言模型。

MedicalGPT医疗大模型强化学习微调医患对话Github开源项目
深度学习学习路线图 - 入门指南与资源汇总

深度学习学习路线图 - 入门指南与资源汇总

本文整理了deep-learning-roadmap项目的学习资源,为想要入门深度学习的读者提供全面的学习路线图,包括理论基础、经典模型、核心技术、应用领域等方面的内容。

深度学习卷积神经网络生成模型强化学习图像识别Github开源项目
RLCard入门指南 - 强化学习卡牌游戏工具包

RLCard入门指南 - 强化学习卡牌游戏工具包

RLCard是一个用于卡牌游戏强化学习的开源工具包,支持多种流行卡牌游戏环境和算法。本文介绍RLCard的主要特性和使用方法,帮助读者快速入门。

RLCard强化学习卡牌游戏算法开源工具Github开源项目
Deep-Learning-Papers-Reading-Roadmap深度学习论文阅读路线图 - 入门学习资料汇总

Deep-Learning-Papers-Reading-Roadmap深度学习论文阅读路线图 - 入门学习资料汇总

Deep-Learning-Papers-Reading-Roadmap是一个帮助新手系统性学习深度学习的论文阅读路线图,包含了深度学习各个领域的经典论文推荐。本文汇总了该项目的主要内容和相关学习资源,为深度学习初学者提供一份全面的入门指南。

深度学习卷积神经网络递归神经网络自然语言处理强化学习Github开源项目
Transformers-Recipe学习资料汇总 - 自然语言处理的革命性架构

Transformers-Recipe学习资料汇总 - 自然语言处理的革命性架构

本文汇总了Transformers-Recipe项目提供的丰富学习资源,帮助读者系统掌握Transformer架构及其在NLP领域的应用。包括入门教程、技术解析、论文导读等多方面内容,是学习Transformer的优质指南。

TransformerNLP计算机视觉强化学习AttentionGithub开源项目
TensorHouse学习资料汇总 - 企业级AI/ML应用的参考实现和演示集合

TensorHouse学习资料汇总 - 企业级AI/ML应用的参考实现和演示集合

TensorHouse是一个为企业用例提供AI/ML应用参考实现和演示的开源项目。本文汇总了TensorHouse的学习资源,包括项目介绍、主要功能、代码库结构、示例笔记本等,帮助读者快速了解和使用这个强大的工具集。

TensorHouseAI/ML应用深度学习强化学习企业解决方案Github开源项目
Alpha Zero General学习资料汇总 - 适用于任何游戏的通用强化学习框架

Alpha Zero General学习资料汇总 - 适用于任何游戏的通用强化学习框架

Alpha Zero General是一个基于AlphaZero算法的通用强化学习框架,可以应用于任何双人回合制对抗游戏。本文汇总了该项目的相关学习资源,帮助读者快速入门和深入学习。

Alpha ZeroOthello强化学习深度学习蒙特卡洛树搜索Github开源项目
neurojs入门指南 - 浏览器端深度学习和强化学习框架

neurojs入门指南 - 浏览器端深度学习和强化学习框架

neurojs是一个专注于浏览器端深度学习和强化学习的JavaScript框架。本文汇总了neurojs的相关学习资源,帮助开发者快速入门这个强大的机器学习工具。

neurojs深度学习强化学习JavaScript框架深度Q网络Github开源项目
Practical_RL - 强化学习实战课程学习资源汇总 - 从理论到实践的开源教程

Practical_RL - 强化学习实战课程学习资源汇总 - 从理论到实践的开源教程

Practical_RL是Yandex数据学院开设的一门开源强化学习课程,内容涵盖从基础理论到前沿算法的实践应用。本文汇总了该课程的各类学习资源,帮助读者系统掌握强化学习知识。

Practical_RL强化学习HSEYSDAGoogle ColabGithub开源项目
TensorLayer学习资料汇总 - 深度学习和强化学习的高效开发库

TensorLayer学习资料汇总 - 深度学习和强化学习的高效开发库

TensorLayer是一个基于TensorFlow的深度学习和强化学习库,专为研究人员和工程师设计。本文汇总了TensorLayer的学习资源,帮助读者快速入门并掌握这个强大的工具。

TensorLayerTensorFlow深度学习强化学习开源软件Github开源项目
ml-agents入门学习资料汇总 - Unity机器学习代理工具包

ml-agents入门学习资料汇总 - Unity机器学习代理工具包

ml-agents是Unity开发的机器学习工具包,可用于训练智能体在游戏和模拟环境中行动。本文汇总了ml-agents的各类学习资源,帮助开发者快速入门。

Unity ML-Agents ToolkitAI强化学习模拟环境游戏开发Github开源项目
Dopamine学习资料汇总 - 快速原型化强化学习算法的研究框架

Dopamine学习资料汇总 - 快速原型化强化学习算法的研究框架

Dopamine是Google开源的强化学习算法研究框架,本文汇总了Dopamine的各种学习资源,包括官方文档、教程、示例代码等,帮助读者快速入门和深入学习这个强大的RL工具。

Dopamine强化学习JAXDQNTensorflowGithub开源项目
DeepMind Lab学习资料汇总 - 一个用于AI研究的可定制3D平台

DeepMind Lab学习资料汇总 - 一个用于AI研究的可定制3D平台

DeepMind Lab是一个基于Quake III Arena的3D学习环境,为AI研究尤其是深度强化学习提供了一套具有挑战性的3D导航和解谜任务。本文汇总了DeepMind Lab的主要学习资源,帮助研究者快速上手这个强大的AI研究平台。

DeepMind Lab人工智能强化学习Bazelioquake3Github开源项目热门
SUMO-RL: 强化学习在交通信号控制中的应用

SUMO-RL: 强化学习在交通信号控制中的应用

SUMO-RL是一个强大的强化学习框架,用于交通信号控制。它提供了简单的接口来创建基于SUMO的强化学习环境,支持多智能体学习,并与流行的RL库兼容。

SUMO-RL强化学习交通信号控制多智能体交通仿真Github开源项目
强化学习论文综述:从经典方法到前沿研究

强化学习论文综述:从经典方法到前沿研究

本文全面总结了强化学习领域的重要论文,涵盖经典算法、表征学习、探索方法等多个方向,梳理了该领域的发展脉络和最新进展。

强化学习论文集模型无关模型相关离线学习Github开源项目
大型语言模型游戏智能体研究前沿:awesome-LLM-game-agent-papers项目综述

大型语言模型游戏智能体研究前沿:awesome-LLM-game-agent-papers项目综述

本文对GitHub上的awesome-LLM-game-agent-papers项目进行了全面介绍,该项目收集了基于大型语言模型的游戏智能体相关研究论文,涵盖了冒险游戏、工艺探索游戏、模拟游戏、竞技游戏、合作游戏、对话游戏和动作游戏等多个领域,代表了该研究方向的最新进展。

LLM游戏智能体人工智能自然语言处理强化学习Github开源项目
Q-Transformer: 基于自回归Q函数的可扩展离线强化学习方法

Q-Transformer: 基于自回归Q函数的可扩展离线强化学习方法

Q-Transformer是一种创新的离线强化学习算法,它利用Transformer架构为Q函数提供了一种可扩展的表示方法,能够有效地从大规模离线数据集中学习多任务策略。本文将深入介绍Q-Transformer的工作原理、关键设计以及在实际机器人操作任务中的出色表现。

Q-Transformer强化学习AI模型神经网络机器人控制Github开源项目
深度强化学习助力人形机器人学习行走

深度强化学习助力人形机器人学习行走

本文介绍了一种基于深度强化学习的方法,用于训练人形机器人实现稳定的双足行走。该方法能够使机器人在不同环境中自主学习行走技能,展现出良好的鲁棒性和适应性。

人形机器人双足行走强化学习MuJoCoPyTorchGithub开源项目