Compendium-of-free-ML-reading-resources

Compendium-of-free-ML-reading-resources

机器学习免费学习资源集合 书籍论文和在线教程

该项目是一个综合性机器学习免费资源集合,涵盖数据分析、数学、统计、机器学习和深度学习等领域。收录内容包括经典教材、最新论文、PDF电子书和在线教程,以英文原版为主。项目提供系统的机器学习知识体系和高质量学习材料,适合入门和进阶学习。资源全面、内容权威、持续更新,定期收录最新开放获取资源,为自学者和研究人员提供最新知识和便利。

机器学习深度学习数据科学统计学线性代数Github开源项目

书籍和arXiv综述论文

(符号说明::orange_book: PDF文件 :earth_africa: HTML电子书)

数据探索分析、可视化和数据清洗

  • :earth_africa: 《Python数据分析(第三版)》作者:Wes McKinney
  • :earth_africa: 《缺失数据的灵活插补》作者:Stef van Buuren
  • :earth_africa: 《数据可视化基础》作者:Claus O. Wilke
  • :earth_africa: 《R图形cookbook》作者:Winston Chang
  • :earth_africa: 《R语言现代数据可视化》作者:Robert Kabacoff
  • :orange_book: 《统计思维:Python中的探索性数据分析》作者:Allen B. Downey
  • :orange_book: 《SQL专业人士笔记》

数学

  • :orange_book: 《机器学习数学基础》作者:Marc Peter Deisenroth、A. Aldo Faisal和Cheng Soon Ong
  • :orange_book: 《矩阵分析》作者:Joel A. Tropp
  • :orange_book: 《线性代数做错了》作者:Sergei Treil
  • :orange_book: 《线性代数做对了》作者:Sheldon Axler
  • :orange_book: 《线性代数:理论与应用》作者:Kenneth Kuttler
  • :orange_book: 《计算机科学与机器学习的代数、拓扑、微积分和优化理论》作者:Jean Gallier和Jocelyn Quaintance
  • :orange_book: 《矩阵手册》作者:Kaare Brandt Petersen和Michael Syskind Pedersen
  • :orange_book: 《应用线性代数导论:向量、矩阵和最小二乘法》作者:Stephen Boyd和Lieven Vandenberghe
  • :orange_book: 《数据科学线性代数》作者:Wanmo Kang和Kyunghyun Cho
  • :earth_africa: 《数据科学线性代数及R语言示例》作者:Shaina Race Bennett

统计学和概率论

  • :orange_book: 《概率与统计 - 不确定性的科学》作者:Michael J. Evans和Jeffrey S. Rosenthal
  • :orange_book: 《高维概率论》作者:Joel A. Tropp
  • :orange_book: 《概率论导论》作者:Joseph K. Blitzstein和Jessica Hwang
  • :orange_book: 《中心极限定理的历史:从经典到现代概率论》作者:Hans Fischer
  • :orange_book: 《贝叶斯思维:简明贝叶斯统计学》作者:Allen B. Downey
  • :orange_book: 《贝叶斯统计学导论》作者:Brendon J. Brewer
  • :orange_book: 《用jamovi学习统计学》作者:Danielle J. Navarro和David R. Foxcroft
  • :orange_book: 《贝叶斯数据分析》作者:Andrew Gelman、John Carlin、Hal Stern、David Dunson、Aki Vehtari和Donald Rubin
  • :orange_book: 《常见概率分布汇编》作者:Michael P. McLaughlin
  • :orange_book: 《数据科学的概率与统计》作者:Carlos Fernandez-Granda
  • :orange_book: 《统计建模:14个主题的探索》作者:Reinhard Furrer

线性回归

  • :orange_book: Cosma Rohilla Shalizi 著《线性回归的真相》
  • :orange_book: Wessel N. van Wieringen 著《岭回归讲义》
  • :orange_book: Peng Ding 著《线性模型及其扩展》
  • :orange_book: Andrew Gelman、Jennifer Hill 和 Aki Vehtari 著《回归与其他故事》
  • :earth_africa: Stéphanie M. van den Berg 著《使用线性模型分析数据》

优化

  • :orange_book: Stephen Boyd 和 Lieven Vandenberghe 著《凸优化》
  • :orange_book: Nicolas Boumal 著《光滑流形上优化的入门》

机器学习

书籍
  • :orange_book: James、Witten、Hastie、Tibshirani 和 Taylor 著《Python 应用中的统计学习导论》
  • :orange_book: Hastie、Tibshirani 和 Friedman 著《统计学习的要素》
  • :orange_book: Bradley Efron 和 Trevor Hastie 著《计算机时代的统计推断:算法、证据和数据科学》
  • :orange_book: Christopher M. Bishop 著《模式识别与机器学习》
  • :orange_book: Kevin Patrick Murphy 著《概率机器学习:入门》
  • :orange_book: Kevin Patrick Murphy 著《概率机器学习:高级主题》
  • :orange_book: Shai Shalev-Shwartz 和 Shai Ben-David 著《理解机器学习:从理论到算法》
  • :orange_book: Mehryar Mohri、Afshin Rostamizadeh 和 Ameet Talwalkar 著《机器学习基础》
  • :orange_book: Carl Edward Rasmussen 和 Christopher K. I. Williams 著《机器学习的高斯过程》
  • :orange_book: David J. C. MacKay 著《信息理论、推理与学习算法》
  • :orange_book: Tong Zhang 著《机器学习算法的数学分析》
  • :orange_book: Soroush Nasiriany、Garrett Thomas、William Wang、Alex Yang、Jennifer Listgarten 和 Anant Sahai 著《机器学习综合指南》
  • :orange_book: Hal Daumé III 著《机器学习课程》
  • :orange_book: Andreas Lindholm、Niklas Wahlström、Fredrik Lindsten 和 Thomas B. Schön 著《机器学习 - 工程师和科学家的第一门课程》
  • :orange_book: Frank Hutter、Lars Kotthoff 和 Joaquin Vanschoren 著《自动机器学习:方法、系统、挑战》
  • :orange_book: Edouard Duchesnay、Tommy Löfstedt 和 Feki Younes 著《Python 中的统计和机器学习》
  • :orange_book: David Barber 著《贝叶斯推理和机器学习》
  • :orange_book: Robert E. Schapire 和 Yoav Freund 著《提升:基础和算法》
  • :orange_book: Mykel J. Kochenderfer、Tim A. Wheeler 和 Kyle H. Wray 著《决策算法》
  • :orange_book: Ilya Katsov 著《算法营销导论》
  • :orange_book: Ian Langmore 和 Daniel Krasner 著《应用数据科学》
  • :orange_book: Andrew Ng 和 Tengyu Ma 著《CS229 讲义》
  • :orange_book: Romain Couillet 和 Zhenyu Liao 著《机器学习的随机矩阵方法》
  • :orange_book: Carl McBride Ellis 著《机器学习橙皮书》
  • :orange_book: Francis Bach 著《从基本原理学习理论》
  • :orange_book: Cosma Rohilla Shalizi 著《从基础角度的高级数据分析》
  • :orange_book: Tom Mitchell 著《机器学习》
  • :earth_africa: Christoph Molnar 和 Timo Freiesleben 著《科学的监督机器学习》
  • :earth_africa: Jake VanderPlas 著《Python 数据科学手册》
  • :earth_africa: 《数据分析指南》,作者:Mike Nguyen
  • :earth_africa: 《表格数据的应用机器学习》,作者:Max Kuhn 和 Kjell Johnson
arXiv
  • :orange_book: Osvaldo Simeone 著《机器学习工程师简介》
  • :orange_book: Alexander Jung 著《机器学习:基础知识》
  • :orange_book: Pankaj Mehta、Marin Bukov、Ching-Hao Wang、Alexandre G.R. Day、Clint Richardson、Charles K. Fisher、David J. Schwab 著《为物理学家提供的高偏差、低方差机器学习入门》
  • :orange_book: Sebastian Raschka 著《机器学习中的模型评估、模型选择和算法选择》
  • :orange_book: Tong Yu 和 Hong Zhu 著《超参数优化:算法和应用综述》
  • :orange_book: Michael A. Lones 著《如何避免机器学习陷阱:学术研究者指南》
  • :orange_book: Steven C. H. Hoi、Doyen Sahoo、Jing Lu 和 Peilin Zhao 著《在线学习:综合调查》

R 相关

  • :earth_africa: Oscar Baruffa 著《R语言大全》
  • :earth_africa: Garrett Grolemund 著《R语言编程实战》
  • :earth_africa: Bradley Boehmke 和 Brandon Greenwell 著《R语言机器学习实战》
  • :earth_africa: Shaina Race Bennett 著《数据科学线性代数及R语言示例》
  • :orange_book: Marek Gagolewski 著《深入R编程》
  • :earth_africa: Colin Gillespie 和 Robin Lovelace 著《高效R编程》
  • :earth_africa: Hadley Wickham、Mine Çetinkaya-Rundel 和 Garrett Grolemund 著《数据科学中的R语言》
  • :earth_africa: Hadley Wickham 著《高级R》
  • :earth_africa: Neale Batra 编《流行病学家R手册》
  • :earth_africa: Konstantinos I. Bougioukas 著《医学实用统计与R》
  • :earth_africa: Julia Silge 和 David Robinson 著《R语言文本挖掘:整洁方法》
  • :earth_africa: Paula Moraga 著《空间统计学在数据科学中的理论与实践:R语言应用》
  • :earth_africa: Winston Chang 著《R图形食谱》
  • :earth_africa: Yigit Aydede 著《社会科学家和政策分析师工具箱:机器学习和R应用预测分析》
  • :earth_africa: Gema Fernández-Avilés Calderón 和 José-María Montero 著《R语言数据科学基础》
  • :earth_africa: Robert Kabacoff 著《R语言现代数据可视化》
  • :earth_africa: Christoph Hanck、Martin Arnold、Alexander Gerber 和 Martin Schmelzer 著《R语言计量经济学导论》
  • :orange_book: Patrick Burns 著《R地狱》

深度学习/神经网络

  • :orange_book: Terence Parr 和 Jeremy Howard 的《深度学习所需的矩阵微积分》
  • :orange_book: Julius Berner、Philipp Grohs、Gitta Kutyniok 和 Philipp Petersen 的《深度学习的现代数学》
  • :orange_book: Daniel A. Roberts、Sho Yaida 和 Boris Hanin 的《深度学习理论原理》
  • :orange_book: Bernhard Mehlig 的《神经网络机器学习》
  • :orange_book: Aston Zhang、Zachary C. Lipton、Mu Li 和 Alexander J. Smola 的《深入深度学习》
  • :orange_book: Yao Ma 和 Jiliang Tang 的《图深度学习》
  • :orange_book: Nils Thuerey、Philipp Holl、Maximilian Mueller、Patrick Schnell、Felix Trost 和 Kiwon Um 的《基于物理的深度学习》
  • :orange_book: Simon J. D. Prince 的《理解深度学习》
  • :orange_book: François Fleuret 的《深度学习小书》
  • :orange_book: Arnulf Jentzen、Benno Kuckuck 和 Philippe von Wurstemberger 的《深度学习的数学入门:方法、实现和理论》
  • :orange_book: Sanjeev Arora 等人的《深度学习理论》
  • :orange_book: Vicki Boykis 的《什么是嵌入》
  • :earth_africa: Christopher M. Bishop 和 Hugh Bishop 的《深度学习:基础和概念》

强化学习

  • :orange_book: Richard S. Sutton 和 Andrew G. Barto 的《强化学习导论》
  • :orange_book: Stefano V. Albrecht、Filippos Christianos 和 Lukas Schäfer 的《多智能体强化学习》
  • :orange_book: Marc G. Bellemare、Will Dabney 和 Mark Rowland 的《分布式强化学习》
  • :orange_book: Shiyu Zhao 的《强化学习的数学基础》

推荐系统

  • :orange_book: Linyuan Lü、Matus Medo、Chi Ho Yeung、Yi-Cheng Zhang、Zi-Ke Zhang 和 Tao Zhou 的《推荐系统》
  • :orange_book: Pablo Castells 和 Dietmar Jannach 的《推荐系统入门》

异常检测

  • :earth_africa: Rob J. Hyndman 的《太奇怪了!使用 R 进行异常检测》

计算机视觉

  • :orange_book: Simon J. D. Prince 的《计算机视觉:模型、学习和推理》
  • :orange_book: Richard Szeliski 的《计算机视觉:算法与应用》(第一版)

自然语言处理(NLP)和大型语言模型(LLM)

  • 📙 Dan Jurafsky 和 James H. Martin 著《语音与语言处理:自然语言处理、计算语言学与语音识别导论》
  • 📙 Michael R. Douglas 著《大型语言模型》
  • 📙 Lingfei Wu、Yu Chen、Kai Shen、Xiaojie Guo、Hanning Gao、Shucheng Li、Jian Pei 和 Bo Long 著《图神经网络在自然语言处理中的应用:综述》
  • 📙 Ryan Cotterell、Anej Svete、Clara Meister、Tianyu Liu 和 Li Du 著《语言建模的形式化方面》
  • 📙 Wayne Xin Zhao 等人著《大型语言模型综述》
  • 📙 Gerhard Paaß 和 Sven Giesselbach 著《自然语言处理的基础模型》
  • 🌍 Julia Silge 和 David Robinson 著《R语言文本挖掘:整洁方法》

因果推断

  • 📙 Jean Kaddour、Aengus Lynch、Qi Liu、Matt J. Kusner 和 Ricardo Silva 著《因果机器学习:综述与开放问题》
  • 📙 Jennie E. Brand、Xiang Zhou 和 Yu Xie 著《因果推断和机器学习的最新进展》
  • 📙 Peng Ding 著《因果推断入门》
  • 📙 Marcos M. López de Prado 著《因果因子投资》
  • 📙 Charles K. Assaad、Emilie Devijver 和 Eric Gaussier 著《时间序列因果发现方法的调查与评估》
  • 📙 Victor Chernozhukov、Christian Hansen、Nathan Kallus、Martin Spindler 和 Vasilis Syrgkanis 著《机器学习和人工智能驱动的应用因果推断》
  • 🌍 Uday Kamath、Kenneth Graham 和 Mitchell Naylor 著《应用因果推断》
  • 🌍 Matheus Facure Alves 著《勇敢者的因果推断》

共形预测

  • 📙 Glenn Shafer 和 Vladimir Vovk 著《共形预测教程》
  • 📙 Matteo Fontana、Gianluca Zeni 和 Simone Vantini 著《共形预测:理论统一回顾与新挑战》
  • 📙 Anastasios N. Angelopoulos 和 Stephen Bates 著《共形预测和无分布不确定性量化温和介绍》

特征工程

  • 🌍 Max Kuhn 和 Kjell Johnson 著《特征工程与选择:预测模型的实用方法》
  • 🌍 Emil Hvitfeldt 著《特征工程从A到Z》

时间序列:预测

  • :earth_africa: Rob J Hyndman 和 George Athanasopoulos 所著的《预测:原理与实践》
  • :orange_book: Fotios Petropoulos 等人所著的《预测:理论与实践》
  • :earth_africa:《预测:理论与实践》(在线版),编辑:Fotios Petropoulos、Yanfei Kang 和 Feng Li
  • :orange_book: Hansika Hewamalagea、Klaus Ackermannb 和 Christoph Bergmeir 所著的《数据科学家的预测评估:常见陷阱和最佳实践》
  • :orange_book: Aryan Jadon、Avinash Patil 和 Shruti Jadon 所著的《基于回归的时间序列预测损失函数综合调查》
  • :orange_book: Alexander Aue 所著的《时间序列分析》
  • :orange_book: John H. Cochrane 所著的《宏观经济学和金融学的时间序列》
  • :earth_africa: Stephan Kolassa、Bahman Rostami-Tabar 和 Enno Siemsen 所著的《面向高管和专业人士的需求预测》

可解释性/可解释性

  • :earth_africa: Christoph Molnar 所著的《可解释机器学习:使黑箱模型可解释的指南》
  • :earth_africa: Przemyslaw Biecek 和 Tomasz Burzykowski 所著的《解释性模型分析》

<sub>注:所有 arXiv 论文本质上是免费的,所有书籍均由各自的作者/出版商免费提供。</sub>

编辑推荐精选

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

下拉加载更多