⚠️ 该仓库未维护。虽然信息仍然相关，但欢迎贡献以保持其更新！一个好的起点是这里引用的文章：https://github.com/ybayle/awesome-deep-learning-music/issues/5

音乐深度学习（DL4M）

由 Yann Bayle（网站，GitHub）创建，来自 LaBRI（网站，Twitter），波尔多大学（网站，Twitter），法国国家科学研究中心（网站，Twitter）和 SCRIME（网站）。

简而言之 不完全的关于音乐深度学习的科学文章列表：总结（文章标题、pdf链接和代码），详情（表格——更多信息），详情（bib——所有信息）

这个精选列表的作用是收集使用深度学习方法应用于音乐的科学文章、论文和报告。该列表目前正在建设中，但欢迎为缺失的部分贡献及添加其他资源！请参考如何贡献部分。这里提供的资源来自我博士论文的最新进展综述，目前一篇相关的文章正在写作中。已经有关于音乐生成，语音分离和讲话者识别的调研报告。然而，这些调研并未涵盖本仓库中包含的音乐信息检索任务。

DL4M总结

            | 年份 | 文章、论文和报告 | 代码 |

DL4M 详情

一个易于阅读的表格版本显示在文件 dl4m.tsv 中。每篇文章的所有详细信息都存储在相应的 bib 条目中 dl4m.bib。每个条目都有常规的 bib 字段：

author
year
title
journal 或 booktitle

每个 dl4m.bib 条目中还显示了其他信息：

link - PDF 文件的 HTML 链接
code - 如果有，源码链接
archi - 神经网络架构
layer - 层数
task - 文章中研究的任务
dataset - 使用的数据集名称
dataaugmentation - 使用的数据增强技术类型
time - 计算时间
hardware - 使用的硬件
note - 附加注释和信息
repro - 实验的可重复性程度

回到顶部

无文章代码

回到顶部

统计和可视化

参考了167 篇论文。详见 dl4m.bib。 2017 年的论文比其他年份的总和还多。每年的文章数量：
如果你将 DL 应用于音乐领域，你有 364 位同行研究者。
研究了 34 项任务。参见任务列表。任务饼图：
使用了 55 个数据集。参见数据集列表。数据集饼图：
使用了 30 种架构。参见架构列表。架构饼图：
使用了 9 个框架。参见框架列表。框架饼图：
只有 47 篇文章 (28%) 提供了源码。可重复性是优秀科学的关键，查看 MIR 和 ML 可重复性有用资源列表。

回到顶部

关于 dl4m 文章的审阅建议

请参见 advice_review.md 文件。

如何贡献

欢迎贡献！请参见 CONTRIBUTING.md 文件。

回到顶部

常见问题

这些文章是如何排序的？

文章首先按年份递减排序（以跟上最新动态），然后按主要作者的姓氏字母顺序排序。

为什么包括来自 arXiv 的预印本？

我想要对 DL4M 进行全面的研究并了解最新动态。然而，对于当前在审的文章信息应谨慎对待。如果可能，你应等待最终接受且经过同行评审的版本再引用 arXiv 文章。我会定期更新 arXiv 链接至相应的已发表论文。

我能多大程度上相信一篇文章发布的结果？

这里提供的列表并不保证文章的质量。你应尝试重现文中的实验或向 ReScience 提交请求。使用一篇文章的结论需自行承担风险。

回到顶部

使用的首字母缩写

一个用于深度学习和音乐的有用首字母缩写列表存储在 acronyms.md 中。

回到顶部

来源

用于收集拟议材料的会议、期刊和聚合器列表存储在 sources.md 中。

回到顶部

贡献者

Yann Bayle (GitHub) - 发起者和主要维护者
Vincent Lostanlen (GitHub)
Keunwoo Choi (GitHub)
Bob L. Sturm (GitHub)
Stefan Balke (GitHub)
Jordi Pons (GitHub)
Mirza Zulfan (GitHub) 设计标志
Devin Walters
https://github.com/LegendJ

回到顶部

其他有用的相关列表和资源

音频

使用 keras 的 DL4MIR 教程 - 由 Thomas Lidy 编写的音乐信息检索深度学习教程
Ron Weiss 的视频演讲 - Ron Weiss（谷歌）关于在波形上训练神经网络声学模型的演讲
DL4M 幻灯片 - 由 Jordi Pons 编写的个人（重新）审视最先进技术的幻灯片
DL4MIR 教程 - 使用 Python 学习解决音乐信息检索任务的深度学习教程
Awesome Python Scientific Audio - 关于音频和机器学习的 Python 资源
ISMIR 资源 - 由社区维护的资源列表
ISMIR Google 小组 - 每日音乐信息检索的资讯
Awesome Python - Python 资源中的音频部分
Awesome Web Audio - WebAudio 包和资源
Awesome Music - 音乐软件
Awesome Music Production - 音乐创作
亚瑟摩夫研究所 - 6 款用于音乐生成的深度学习工具
DLM Google 小组 - 深度学习的音乐小组
MIR 社区在 Slack 上 - 订阅 MIR 社区 Slack 的链接
未分类的 MIR 相关链接列表 - Cory McKay 的 DL、MIR 等各种链接列表
MIRDL - Jordi Pons 提供的未维护的 MIR 深度学习文章列表
WWW 2018 挑战 - 使用 FMA 数据集学习识别音乐类型
使用 DL 生成音乐 - 关于使用深度学习生成音乐的资源列表
听觉场景分析 - Albert Bregman 撰写的一本关于声音感知组织的书籍，被称为“听觉场景分析之父”
- 听觉场景分析演示 - 音频演示，展示了听觉感知组织的例子