<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="知识共享许可协议" style="border-width:0" src="https://img.shields.io/badge/license-CC%20BY--NC--SA%204.0-lightgrey" /></a>
李宏毅老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂,他会通过很多有趣的例子来讲解强化学习理论。比如老师经常会用玩 Atari 游戏的例子来讲解强化学习算法。此外,为了教程的完整性,我们整理了周博磊老师的《强化学习纲要》、李科浇老师的《世界冠军带你从零实践强化学习》以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。
本教程也称为"蘑菇书",寓意是希望此书能够为读者注入活力,让读者"吃"下这本蘑菇之后,能够饶有兴致地探索强化学习,像马里奥那样愈加强大,继而在人工智能领域觅得意外的收获。
豆瓣评分:https://book.douban.com/subject/35781275/
ℹ️ 勘误修订表:https://datawhalechina.github.io/easy-rl/#/errata
地址:https://datawhalechina.github.io/easy-rl/
地址:https://github.com/datawhalechina/easy-rl/releases
国内地址(推荐国内读者使用):链接: https://pan.baidu.com/s/1isqQnpVRWbb3yh83Vs0kbw 提取码: us6a
压缩版(推荐网速较差的读者使用,文件小,图片分辨率较低):链接: https://pan.baidu.com/s/1mUECyMKDZp-z4-CGjFhdAw 提取码: tzds
PDF版本是全书初稿,人民邮电出版社的编辑老师们对初稿进行了反复修缮,最终诞生了纸质书籍,在此向人民邮电出版社的编辑老师的认真严谨表示衷心的感谢!(附:校对样稿)
<center class="half"><img src="https://yellow-cdn.veclightyear.com/835a84d5/46b9cfec-87b8-4822-a336-9d6c3c8883e3.png" width="680"></center>算法实战部分包括附书代码和JoyRL代码:
点击或者网页点击papers
文件夹进入经典强化学习论文解读
王琦,杨毅远,江季,Easy RL:强化学习教程,人民邮电出版社,https://github.com/datawhalechina/easy-rl, 2022.
Qi Wang, Yiyuan Yang, Ji Jiang,Easy RL: Reinforcement Learning Tutorial,Posts & Telecom Press,https://github.com/datawhalechina/easy-rl, 2022.
@book{wang2022easyrl, title = {Easy RL:强化学习教程}, publisher = {人民邮电出版社}, year = {2022}, author = {王琦,杨毅远,江季}, address = {北京}, isbn = {9787115584700}, url = {https://github.com/datawhalechina/easy-rl} }
@book{wang2022easyrl, title = {Easy RL: Reinforcement Learning Tutorial}, publisher = {Posts & Telecom Press}, year = {2022}, author = {Qi Wang, Yiyuan Yang, Ji Jiang}, address = {Beijing}, isbn = {9787115584700}, url = {https://github.com/datawhalechina/easy-rl} }
如果您需要转载该教程的内容,请注明出处:https://github.com/datawhalechina/easy-rl。
特别感谢 @Sm1les、@LSGOMYP 对本项目的帮助与支持。
扫描下方二维码关注公众号:Datawhale,回复关键词"Easy-RL读者交流群",即可加入"Easy-RL读者交流群"
<div align=center><img src="https://yellow-cdn.veclightyear.com/835a84d5/a31e76a9-1e4f-4044-bd4e-df0998b08f7d.jpeg" width = "250" height = "270" alt="Datawhale是一个专注AI领域的开源组织,以"for the learner,和学习者一起成长"为愿景,构建对学习者最有价值的开源学习社区。关注我们,一起学习成长。"></div><a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="知识共享许可协议" style="border-width:0" src="https://img.shields.io/badge/license-CC%20BY--NC--SA%204.0-lightgrey" /></a><br />本作品采用<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议</a>进行许可。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。