must-read-papers-for-ml

must-read-papers-for-ml

精选机器学习和数据科学必读论文资源集

本项目汇集了数据科学、机器学习和深度学习领域的重要论文和综述文章。涵盖数据预处理、深度学习技术、推荐系统和计算机视觉等多个主题。资源按重要性分类,并提供链接,方便读者学习和追踪最新进展。项目持续更新,欢迎贡献新的学术资源。

机器学习深度学习数据科学神经网络论文集Github开源项目

数据科学、机器学习和深度学习必读论文

精选的数据科学、机器学习和深度学习论文、综述和文章集合,属于必读清单。


注意::construction: 正在更新中,如果您有其他需要添加的论文、文章或博客,请告诉我,我会将它们添加到这里。

如何使用

:point_right: 给这个仓库加 :star:

贡献

  • :point_right: :arrows_clockwise: 如果链接失效,或者我遗漏了任何重要的论文、博客或文章,欢迎提交拉取请求

维护状态

:point_down: 请阅读以下内容 :point_down:

  • :point_right: 阅读包含大量数学内容的论文很困难,需要时间和精力去理解,大部分取决于坚持和不放弃的动力,不要气馁,读一遍,读两遍,读三遍,...直到豁然开朗,让你眼前一亮。

:1st_place_medal: - 首先阅读

:2nd_place_medal: - 其次阅读

:3rd_place_medal: - 第三阅读


数据科学

:bar_chart: 预处理与探索性数据分析

:1st_place_medal: :page_facing_up:数据预处理 - 整洁数据 - 作者:Hadley Wickham

:notebook: 通用数据科学

:1st_place_medal: :page_facing_up: 统计建模:两种文化 - 作者:Leo Breiman

:2nd_place_medal: :page_facing_up: 罗生门曲线与体积研究:机器学习中泛化和模型简单性的新视角

:1st_place_medal: :page_facing_up: 频率主义与贝叶斯主义:Python驱动的入门 - 作者:Jake VanderPlas


机器学习

:dart: 通用机器学习

:1st_place_medal: :page_facing_up: 机器学习中的模型评估、模型选择和算法选择 - 作者:Sebastian Raschka

:1st_place_medal: :page_facing_up: 机器学习简介 - 作者:Gunnar Ratsch

:3rd_place_medal: :page_facing_up: 共轭梯度法入门:无痛苦版 - 作者:Jonathan Richard Shewchuk

:3rd_place_medal: :page_facing_up: 模型稳定性作为随机种子的函数

:mag: 异常/离群值检测

:1st_place_medal: :newspaper: 离群值检测:综述

:rocket: 提升方法

:2nd_place_medal: :page_facing_up: XGBoost:可扩展的树提升系统

:2nd_place_medal: :page_facing_up: LightGBM:一种高效的梯度提升决策树

:2nd_place_medal: :page_facing_up: AdaBoost和分类器超级碗 - 自适应提升的入门教程

:3rd_place_medal: :page_facing_up: 贪婪函数逼近:梯度提升机

:book: 解析黑盒机器学习

:3rd_place_medal: :page_facing_up: 窥视黑盒内部:通过个体条件期望图可视化统计学习

:3rd_place_medal: :page_facing_up: 数据沙普利值:机器学习中的公平数据估值

:scissors: 降维

:1st_place_medal: :page_facing_up: 主成分分析教程

:2nd_place_medal: :page_facing_up: 如何有效使用t-SNE

:3rd_place_medal: :page_facing_up: 使用t-SNE可视化数据

:chart_with_upwards_trend: 优化

:1st_place_medal: :page_facing_up: 贝叶斯优化教程

:2nd_place_medal: :page_facing_up: 将人类从循环中移除:贝叶斯优化综述


知名博客

Sebastian Raschka Chip Huyen


:8ball: :crystal_ball: 推荐系统

综述

:1st_place_medal: :page_facing_up: 协同过滤技术综述

:1st_place_medal: :page_facing_up: 协同过滤推荐系统

:1st_place_medal: :page_facing_up: 基于深度学习的推荐系统:综述与新视角

:1st_place_medal: :page_facing_up: :thinking: :star: 可解释推荐:综述与新视角 :star:

案例研究

:2nd_place_medal: :page_facing_up: Netflix推荐系统:算法、商业价值和创新

:2nd_place_medal: :globe_with_meridians: Spotify是如何如此了解你的?

:point_right: 深入学习,:closed_book: 推荐系统手册


著名深度学习博客 :cowboy_hat_face:

:globe_with_meridians: 斯坦福UFLDL深度学习教程

:globe_with_meridians: Distill.pub

:globe_with_meridians: Colah的博客

:globe_with_meridians: Andrej Karpathy

:globe_with_meridians: Zack Lipton

:globe_with_meridians: Sebastian Ruder

:globe_with_meridians: Jay Alammar


:books: 神经网络与深度学习神经网络

:star: :1st_place_medal: :newspaper: 深度学习所需的矩阵微积分 - Terence Parr 和 Jeremy Howard :star:

:1st_place_medal: :newspaper: 深度学习 - Yann LeCun, Yoshua Bengio & Geoffrey Hinton

:1st_place_medal: :page_facing_up: 深度学习中的泛化

:1st_place_medal: :page_facing_up: 人工神经网络学习的拓扑结构

:1st_place_medal: :page_facing_up: Dropout:防止神经网络过拟合的简单方法

:2nd_place_medal: :page_facing_up: 多项式回归作为神经网络的替代方案

:2nd_place_medal: :globe_with_meridians: 神经网络动物园

:2nd_place_medal: :globe_with_meridians: 使用TensorFlow进行深度学习图像补全

:2nd_place_medal: :page_facing_up: 批量归一化:通过减少内部协变量偏移来加速深度网络训练

:3rd_place_medal: :page_facing_up: 卷积神经网络中类别不平衡问题的系统研究

:3rd_place_medal: :page_facing_up: 所有神经网络都是平等的

:3rd_place_medal: :page_facing_up: Adam:一种随机优化方法

:3rd_place_medal: :page_facing_up: AutoML:最新技术综述

:framed_picture: CNN

:1st_place_medal: :page_facing_up: 可视化和理解卷积网络 - Andrej Karpathy Justin Johnson Li Fei-Fei

:2nd_place_medal: :page_facing_up: 用于图像识别的深度残差学习

:2nd_place_medal: :page_facing_up:AlexNet - 使用深度卷积神经网络进行ImageNet分类

:2nd_place_medal: :page_facing_up:VGG Net - 用于大规模图像识别的超深度卷积网络

:3rd_place_medal: :page_facing_up: 用于特征提取的深度卷积神经网络的数学理论

:3rd_place_medal: :page_facing_up: 使用卷积神经网络进行大规模视频分类

:3rd_place_medal: :page_facing_up: 用于图像描述和视觉问答的自下而上和自上而下注意力

:black_circle: CapsNet :trident:

:1st_place_medal: :page_facing_up: 胶囊之间的动态路由

:national_park: :speech_balloon: 图像描述

:1st_place_medal: :page_facing_up: Show and Tell:神经图像描述生成器

:2nd_place_medal: :page_facing_up: 通过联合学习对齐和翻译的神经机器翻译

:2nd_place_medal: :page_facing_up: StyleNet:用风格生成有吸引力的视觉描述

:2nd_place_medal: :page_facing_up: Show, Attend and Tell:具有视觉注意力的神经图像描述生成

:2nd_place_medal: :page_facing_up: 在图像描述生成器中何处放置图像

:2nd_place_medal: :page_facing_up: Dank学习:使用深度神经网络生成表情包

:car: :walking_man: 目标检测 :eagle: :football:

:2nd_place_medal: :page_facing_up:ResNet - 用于图像识别的深度残差学习 :2nd_place_medal: :page_facing_up: YOLO-你只看一次:统一的实时目标检测

:2nd_place_medal: :page_facing_up: 微软COCO:上下文中的常见对象

:2nd_place_medal: :page_facing_up: (R-CNN)用于精确目标检测和语义分割的丰富特征层次结构

:2nd_place_medal: :page_facing_up: 快速R-CNN

:2nd_place_medal: :page_facing_up: 更快速的R-CNN

:2nd_place_medal: :page_facing_up: Mask R-CNN

:car: :walking_man: :couple: 姿态检测 :runner: :dancer:

:2nd_place_medal: :page_facing_up: DensePose:野外环境下的密集人体姿态估计

:2nd_place_medal: :page_facing_up: 用于实例级人体分析的Parsing R-CNN

:abcd: :symbols: 深度自然语言处理 :currency_exchange: :1234:

:1st_place_medal: :page_facing_up: 自然语言处理神经网络模型入门

:1st_place_medal: :page_facing_up: 门控循环神经网络在序列建模上的实证评估

:1st_place_medal: :page_facing_up: 神经机器翻译的编码器-解码器方法的特性研究

:1st_place_medal: :page_facing_up: LSTM:搜索空间的奥德赛 - Klaus Greff等人著

:1st_place_medal: :page_facing_up: 用于序列学习的循环神经网络的批判性回顾

:1st_place_medal: :page_facing_up: 可视化和理解循环网络

:star: :1st_place_medal: :page_facing_up: 注意力就是一切 :star:

:1st_place_medal: :page_facing_up: 循环网络架构的实证探索

:1st_place_medal: :page_facing_up: OpenAI (GPT-2)语言模型是无监督的多任务学习器

:1st_place_medal: :page_facing_up: BERT:用于语言理解的深度双向Transformer预训练

:3rd_place_medal: :page_facing_up: NLP的参数高效迁移学习

:3rd_place_medal: :page_facing_up: 用于句子分类的卷积神经网络的敏感性分析(及从业者指南)

:3rd_place_medal: :page_facing_up: 深度学习模型在命名实体识别中的最新进展综述

:3rd_place_medal: :page_facing_up: 用于句子分类的卷积神经网络

:3rd_place_medal: :page_facing_up: 普遍注意力:用于序列到序列预测的2D卷积神经网络

:3rd_place_medal: :page_facing_up: 单头注意力RNN:停止用你的头思考

:alien: 生成对抗网络

:1st_place_medal: :page_facing_up: 生成对抗网络 - Goodfellow等人著

:books: GAN兔子洞 -> GAN论文

:o::heavy_minus_sign::o: 图神经网络(GNN)

:3rd_place_medal: :page_facing_up: 图神经网络综合调查


:man_health_worker: :syringe: 医疗AI :pill: :microscope:

机器学习分类器和fMRI:教程概述 - Francisco等人著


:point_down: 有趣的内容 :point_down:

:loud_sound: :page_facing_up: SoundNet:从未标记视频中学习声音表示

:art: :page_facing_up: CAN:通过学习风格并偏离风格规范来生成"艺术"的创造性对抗网络

:art: :page_facing_up: 深度绘画和谐化

:man_dancing: :dancer: :page_facing_up: 人人都能跳舞

:soccer: 桌面上的足球

:blonde_woman: :haircut_woman: :page_facing_up: SC-FEGAN:带有用户草图和颜色的人脸编辑生成对抗网络

:camera_flash: :page_facing_up: 极低光照条件下的手持移动摄影 :japanese_castle: :mosque: :page_facing_up: 使用Places数据库学习深度特征进行场景识别

:bullettrain_front: :bullettrain_side: :page_facing_up: 使用核化相关滤波器进行高速跟踪

:clapper: :page_facing_up: 语义图像分割的最新进展

深入探索 -> :loud_sound: :globe_with_meridians: Analytics Vidhya十大音频处理任务及其相关论文

:blonde_man: -> :older_man: :page_facing_up: :page_facing_up: 使用条件生成对抗网络进行人脸老化

:blonde_man: -> :older_man: :page_facing_up: :page_facing_up: 使用双条件生成对抗网络进行人脸老化和年轻化

:balance_scale: :page_facing_up: BAGAN: 使用平衡生成对抗网络进行数据增强

labml.ai 带注释的PyTorch论文实现


:newspaper: 毕业设计项目 :newspaper:

8个出色的数据科学毕业设计项目

数据科学中线性代数的10个强大应用

生成对抗网络的5个有趣应用

初学者可以在几分钟内构建的深度学习应用


更新日志

2019-10-28 创建"机器学习必读论文"仓库

2019-10-29 添加Analytics Vidhya用例研究文章链接

2019-10-30 添加异常/异常值检测论文,分离Boosting、CNN、目标检测、NLP论文,并添加图像标注论文

2019-10-31 添加知名深度学习和机器学习研究者的博客

2019-11-1 修复Markdown问题,添加贡献指南

2019-11-20 添加推荐系统综述和论文

2019-12-12 添加R-CNN变体、PoseNet、GNN

2020-02-23 添加GRU论文

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多