本仓库包含用于创建 Hugging Face 音频 Transformers 课程 的内容。 该课程教你如何将 Transformers 应用于音频和语音处理的各种任务。它完全免费且开源!
| 语言 | 源代码 | 作者 |
|---|---|---|
| 孟加拉语 | chapters/bn | |
| 英语 | chapters/en | |
| 西班牙语 | chapters/es | |
| 法语 | chapters/fr | |
| 韩语 | chapters/ko | |
| 俄语 | chapters/ru | @blademoon, @Lightmourne |
| 土耳其语 | chapters/tr | |
| 中文(简体) | chapters/zh-CN |
作为我们让机器学习民主化使命的一部分,我们希望这门课程能够提供更多语言版本! 如果你想帮助将课程翻译成你的语言,请按照以下步骤操作🙏。
🗞️ 提出问题
首先,前往本仓库的 Issues 页面,查看是否有人已经为你的语言开启了一个 issue。如果没有,点击 New issue 按钮,选择 Translation template 来创建一个新的 issue。
一旦创建了 issue,请在评论中说明你想负责哪些章节的翻译工作,我们会将你的名字添加到列表中。
🗣 加入我们的 Discord
由于通过 GitHub issues 很难快速讨论翻译细节,我们在 Discord 服务器上为每种语言创建了专门的频道。点击这 里加入 👉:http://hf.co/join/discord
🍴 复刻仓库
接下来,你需要 复刻这个仓库。你可以通过点击本仓库页面右上角的 Fork 按钮来完成这一步。
复刻仓库后,你需要将文件克隆到本地机器上进行编辑。你可以使用 Git 通过以下命令克隆复刻:
git clone https://github.com/YOUR-USERNAME/audio-transformers-course
📋 复制英文文件并使用新的语言代码
课程文件组织在一个主目录下:
chapters:与课程相关的所有文本和代码片段。你只需要复制 chapters/en 目录中的文件,所以首先进入你复刻的仓库,然后运行以下命令:
cd ~/path/to/audio-transformers-course cp -r chapters/en/CHAPTER-NUMBER chapters/LANG-ID/CHAPTER-NUMBER
这里的CHAPTER-NUMBER指你想要处理的章节,而LANG-ID应该是ISO 639-1(两个小写字母)语言代码——可以在这里查看一个方便的表格。
或者,也支持{两个小写字母}-{两个大写字母}的格式,例如zh-CN,这里有一个示例。
✍️ 开始翻译
现在开始有趣的部分——翻译文本!我们首先建议翻译_toctree.yml文件中对应你的章节的 部分。这个文件用于在网站上渲染目录并提供Colab笔记本的链接。你只应该更改title字段——例如,这里是我们为NLP课程的第0章翻译的_toctree.yml部分:
- title: 0. 设置 # 翻译这里! sections: - local: chapter0/1 # 不要改变这里! title: 简介 # 翻译这里!
🚨 确保
_toctree.yml文件只包含已翻译的部分!否则你将无法在网站上或本地构建内容(见下文如何操作)。
一旦你翻译了_toctree.yml文件,你就可以开始翻译与你的章节相关的MDX文件了。
🙋 如果你的语言还没有
_toctree.yml文件,你可以简单地通过复制粘贴英文版本并删除与你的章节无关的部分来创建一个。只要确保它存在于chapters/LANG-ID/目录中即可!
👷♂️ 在本地构建课程
一旦你对你的修改感到满意,你可以通过首先安装我们用于构建Hugging Face所有文档的doc-builder工具来预览它们的效果:
python -m pip install hf-doc-builder
doc-builder preview audio-transformers-course ../audio-transformers-course/chapters/LANG-ID --not_python_module
这将在http://localhost:3000/上构建和渲染课程。尽管内容在Hugging Face网站上看起来更好,但这一步仍然可以让你检查所有内容是否格式正确。
🚀 提交拉取请求
如果翻译在本地看起来不错,最后一步是准备内容以提交拉取请求。在这里,首先要检查文件格式是否正确。为此,你可以运行:
pip install -r requirements.txt
make style
运行完毕后,提交所有更改,打开一个拉取请求,然后等待审核。恭喜,你现在完成了你的第一个翻译🥳!
🚨 要在网站上构建课程,请再次检查你的语言代码是否存在于
.github文件夹中的build_documentation.yml和build_pr_documentation.yml文件的languages字段中。如果没有,只需按字母顺序添加它们。
包含课程所有代码的Jupyter笔记本托管在huggingface/notebooks仓库中。如果你希望在本地生成它们,首先安装所需的依赖项:
python -m pip install -r requirements.txt
然后运行以下脚本:
python utils/generate_notebooks.py --output_dir nbs
这个脚本从各章节中提取所有代码片段,并将它们作为笔记本存储在nbs文件夹中(默认情况下Git会忽略该文件夹)。
注意:我们目前不接受社区对新章节的贡献。这些说明是为Hugging Face作者准备的。
向课程添加新章节非常简单:
chapters/en/chapterX下创建一个新目录,其中chapterX是你想添加的章节。sectionX.mdx。_toctree.yml文件以包含你的章节部分——这些信息将在网站上渲染目录。如果你的部分涉及transformers的PyTorch和TensorFlow API,确保在colab字段中包含两个Colab的链接。如果你遇到困难,可以查看一下现有的章节——这通常会向你展示预期的语法。
一旦你对内容感到满意,打开一个拉取请求并等待审核。我们建议将第一章草稿作为单个拉取请求添加——然后团队将在内部提供反馈以迭代 内容🤗!
这个仓库和README的结构受到了出色的使用spaCy进行高级自然语言处理课程的启发。


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!


多风格AI绘画神器
堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。


零代码AI应用开发平台
零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号