audio-transformers-course

audio-transformers-course

Transformers在音频和语音处理中的应用与实践

audio-transformers-course是一个开源课程项目,聚焦于Transformers模型在音频和语音处理领域的应用。课程提供多语言版本,内容包括详细教程、代码示例和Jupyter notebooks,适合开发者和研究人员学习音频Transformers技术。项目支持社区参与翻译,致力于推广音频处理的前沿知识。

Audio Transformers CourseHugging Face开源多语言机器学习Github开源项目

音频 Transformers 课程

本仓库包含用于创建 Hugging Face 音频 Transformers 课程 的内容。 该课程教你如何将 Transformers 应用于音频和语音处理的各种任务。它完全免费且开源!

🌎 语言和翻译

语言源代码作者
孟加拉语chapters/bn
英语chapters/en
西班牙语chapters/es
法语chapters/fr
韩语chapters/ko
俄语chapters/ru@blademoon, @Lightmourne
土耳其语chapters/tr
中文(简体)chapters/zh-CN

将课程翻译成你的语言

作为我们让机器学习民主化使命的一部分,我们希望这门课程能够提供更多语言版本! 如果你想帮助将课程翻译成你的语言,请按照以下步骤操作🙏。

🗞️ 提出问题

首先,前往本仓库的 Issues 页面,查看是否有人已经为你的语言开启了一个 issue。如果没有,点击 New issue 按钮,选择 Translation template 来创建一个新的 issue。

一旦创建了 issue,请在评论中说明你想负责哪些章节的翻译工作,我们会将你的名字添加到列表中。

🗣 加入我们的 Discord

由于通过 GitHub issues 很难快速讨论翻译细节,我们在 Discord 服务器上为每种语言创建了专门的频道。点击这里加入 👉:http://hf.co/join/discord

🍴 复刻仓库

接下来,你需要 复刻这个仓库。你可以通过点击本仓库页面右上角的 Fork 按钮来完成这一步。

复刻仓库后,你需要将文件克隆到本地机器上进行编辑。你可以使用 Git 通过以下命令克隆复刻:

git clone https://github.com/YOUR-USERNAME/audio-transformers-course

📋 复制英文文件并使用新的语言代码

课程文件组织在一个主目录下:

  • chapters:与课程相关的所有文本和代码片段。

你只需要复制 chapters/en 目录中的文件,所以首先进入你复刻的仓库,然后运行以下命令:

cd ~/path/to/audio-transformers-course cp -r chapters/en/CHAPTER-NUMBER chapters/LANG-ID/CHAPTER-NUMBER

这里的CHAPTER-NUMBER指你想要处理的章节,而LANG-ID应该是ISO 639-1(两个小写字母)语言代码——可以在这里查看一个方便的表格。 或者,也支持{两个小写字母}-{两个大写字母}的格式,例如zh-CN,这里有一个示例

✍️ 开始翻译

现在开始有趣的部分——翻译文本!我们首先建议翻译_toctree.yml文件中对应你的章节的部分。这个文件用于在网站上渲染目录并提供Colab笔记本的链接。你只应该更改title字段——例如,这里是我们为NLP课程的第0章翻译的_toctree.yml部分:

- title: 0. 设置 # 翻译这里! sections: - local: chapter0/1 # 不要改变这里! title: 简介 # 翻译这里!

🚨 确保_toctree.yml文件只包含已翻译的部分!否则你将无法在网站上或本地构建内容(见下文如何操作)。

一旦你翻译了_toctree.yml文件,你就可以开始翻译与你的章节相关的MDX文件了。

🙋 如果你的语言还没有_toctree.yml文件,你可以简单地通过复制粘贴英文版本并删除与你的章节无关的部分来创建一个。只要确保它存在于chapters/LANG-ID/目录中即可!

👷‍♂️ 在本地构建课程

一旦你对你的修改感到满意,你可以通过首先安装我们用于构建Hugging Face所有文档的doc-builder工具来预览它们的效果:

python -m pip install hf-doc-builder
doc-builder preview audio-transformers-course ../audio-transformers-course/chapters/LANG-ID --not_python_module

这将在http://localhost:3000/上构建和渲染课程。尽管内容在Hugging Face网站上看起来更好,但这一步仍然可以让你检查所有内容是否格式正确。

🚀 提交拉取请求

如果翻译在本地看起来不错,最后一步是准备内容以提交拉取请求。在这里,首先要检查文件格式是否正确。为此,你可以运行:

pip install -r requirements.txt
make style

运行完毕后,提交所有更改,打开一个拉取请求,然后等待审核。恭喜,你现在完成了你的第一个翻译🥳!

🚨 要在网站上构建课程,请再次检查你的语言代码是否存在于.github文件夹中的build_documentation.ymlbuild_pr_documentation.yml文件的languages字段中。如果没有,只需按字母顺序添加它们。

📔 Jupyter笔记本

包含课程所有代码的Jupyter笔记本托管在huggingface/notebooks仓库中。如果你希望在本地生成它们,首先安装所需的依赖项:

python -m pip install -r requirements.txt

然后运行以下脚本:

python utils/generate_notebooks.py --output_dir nbs

这个脚本从各章节中提取所有代码片段,并将它们作为笔记本存储在nbs文件夹中(默认情况下Git会忽略该文件夹)。

✍️ 贡献新章节

注意:我们目前不接受社区对新章节的贡献。这些说明是为Hugging Face作者准备的。

向课程添加新章节非常简单:

  1. chapters/en/chapterX下创建一个新目录,其中chapterX是你想添加的章节。
  2. 为每个部分添加编号的MDX文件sectionX.mdx
  3. 更新_toctree.yml文件以包含你的章节部分——这些信息将在网站上渲染目录。如果你的部分涉及transformers的PyTorch和TensorFlow API,确保在colab字段中包含两个Colab的链接。

如果你遇到困难,可以查看一下现有的章节——这通常会向你展示预期的语法。

一旦你对内容感到满意,打开一个拉取请求并等待审核。我们建议将第一章草稿作为单个拉取请求添加——然后团队将在内部提供反馈以迭代内容🤗!

🙌 致谢

这个仓库和README的结构受到了出色的使用spaCy进行高级自然语言处理课程的启发。

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

热门AI工具AI办公办公工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

模型训练热门AI工具内容创作智能问答AI开发讯飞星火大模型多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多