值得探索的AI开源项目:工具、网站与应用合集

SenseVoice学习资料汇总 - 多语种语音理解模型

SenseVoice学习资料汇总 - 多语种语音理解模型

SenseVoice是一个具有多种语音理解能力的语音基础模型,包括自动语音识别(ASR)、口语语言识别(LID)、语音情感识别(SER)和音频事件检测(AED)。本文汇总了SenseVoice项目的各种学习资源,帮助读者快速入门和深入学习。

SenseVoice多语言语音识别情绪识别音频事件检测推理效率Github开源项目热门
STT语音识别转文字工具 - 离线运行的本地语音识别服务

STT语音识别转文字工具 - 离线运行的本地语音识别服务

STT是一个基于fast-whisper开源模型的离线语音识别工具,可将音视频中的语音转为文字,支持多种输出格式,是OpenAI等在线语音识别API的替代方案。

语音识别fast-whisper本地部署CUDA加速文本输出Github开源项目热门
MinIO入门指南 - 高性能对象存储系统使用教程

MinIO入门指南 - 高性能对象存储系统使用教程

MinIO是一款高性能、S3兼容的开源对象存储系统。本文介绍了MinIO的基本概念、安装部署方法和常用操作,帮助读者快速上手使用MinIO。

MinIO对象存储亚马逊S3兼容Erasure CodingMinIO控制台Github开源项目热门
Whisper入门学习资料 - 强大的多语言语音识别模型

Whisper入门学习资料 - 强大的多语言语音识别模型

Whisper是OpenAI发布的强大语音识别模型,支持多语言识别、翻译等功能。本文汇总了Whisper的相关学习资源,帮助读者快速入门和掌握这一开源工具。

Whisper语音识别多语言处理OpenAITransformer模型Github开源项目热门
OpenVoice学习资料汇总 - 即时多语言声音克隆工具

OpenVoice学习资料汇总 - 即时多语言声音克隆工具

OpenVoice是一个强大的即时声音克隆工具,只需一个短音频即可复制说话者的声音并生成多语言语音。本文汇总了OpenVoice的各类学习资源,包括官方文档、代码仓库、演示示例等,帮助读者快速入门并深入了解这个项目。

OpenVoice语音克隆多语言支持商业使用音频质量Github开源项目热门
IMS-Toucan入门指南-多语言可控文本转语音工具包

IMS-Toucan入门指南-多语言可控文本转语音工具包

IMS-Toucan是一款强大的多语言文本转语音工具包,支持7000多种语言,由斯图加特大学开发。本文介绍了IMS-Toucan的主要功能、安装方法、使用教程以及相关学习资源。

IMS Toucan语音合成多语言预训练模型PythonGithub开源项目热门
GPT-SoVITS学习资料汇总 - 只需1分钟语音数据即可训练出优质TTS模型

GPT-SoVITS学习资料汇总 - 只需1分钟语音数据即可训练出优质TTS模型

GPT-SoVITS是一个强大的少样本语音克隆和文本转语音WebUI工具,本文汇总了该项目的核心特性、安装方法、使用教程等学习资源,帮助读者快速上手这一前沿语音合成技术。

GPT-SoVITS-WebUI文本转语音跨语言支持WebUI工具模型训练Github开源项目热门
MARS5-TTS入门学习资料汇总 - 开源高性能文本转语音模型

MARS5-TTS入门学习资料汇总 - 开源高性能文本转语音模型

MARS5-TTS是一个开源的高性能文本转语音模型,能够生成极具表现力的语音。本文汇总了MARS5-TTS的入门学习资料,帮助读者快速上手使用这一强大的TTS模型。

MARS5语音模型CAMB.AI自然语言处理深度学习Github开源项目热门
ChatTTS学习资料汇总 - 专为对话场景设计的AI语音合成模型

ChatTTS学习资料汇总 - 专为对话场景设计的AI语音合成模型

ChatTTS是一个专为对话场景设计的文本转语音模型,本文汇总了该项目的各种学习资源,包括官方文档、代码仓库、教程视频等,帮助读者快速入门这个强大的AI语音合成工具。

ChatTTS文本转语音对话系统开源多语言支持Github开源项目热门
Fish Speech入门学习资料汇总 - 全新的TTS解决方案

Fish Speech入门学习资料汇总 - 全新的TTS解决方案

Fish Speech是一个创新的文本转语音(TTS)项目,本文汇总了该项目的各种学习资源,帮助读者快速入门和了解这一强大的语音合成工具。

Fish Audio语音合成本地推断在线演示开源Github开源项目热门
MindsDB入门学习资料 - 构建企业级AI应用的开源平台

MindsDB入门学习资料 - 构建企业级AI应用的开源平台

MindsDB是一个开源的AI应用构建平台,可以帮助开发者从企业数据中快速构建和部署AI模型。本文汇总了MindsDB的主要学习资源,包括官方文档、教程、示例等,帮助读者快速入门和深入学习这个强大的AI开发工具。

MindsDBAI模型部署实时预测数据源整合自动化工作流Github开源项目热门
gpt-pilot入门学习资料汇总 - 真正的AI开发者助手

gpt-pilot入门学习资料汇总 - 真正的AI开发者助手

gpt-pilot是一个开源的AI开发助手项目,旨在通过与用户对话来构建完整的应用程序。本文汇总了gpt-pilot的入门学习资料,包括项目介绍、安装使用、示例应用等,帮助开发者快速上手这个强大的AI开发工具。

GPT PilotPythagoraAI应用开发VS Code插件代码生成Github开源项目热门
spaCy学习资源汇总 - 工业级自然语言处理Python库

spaCy学习资源汇总 - 工业级自然语言处理Python库

spaCy是一个强大的Python自然语言处理库,本文汇总了spaCy的学习资源,包括官方文档、教程、模型下载等,帮助读者快速入门和深入学习spaCy。

spaCy自然语言处理Python神经网络模型训练系统Github开源项目热门
Open WebUI 学习资源汇总 - 用户友好的本地大语言模型界面

Open WebUI 学习资源汇总 - 用户友好的本地大语言模型界面

Open WebUI 是一个功能丰富、用户友好的自托管 Web 界面,专为离线运行大型语言模型而设计。本文汇总了 Open WebUI 的主要特性、安装方法和学习资源,帮助用户快速上手这个强大的 LLM 工具。

Open WebUIOllamaDocker安装LLM交互多语言支持Github开源项目热门
Gold-miner 掘金翻译计划学习资源汇总 - 高质量英译中技术社区

Gold-miner 掘金翻译计划学习资源汇总 - 高质量英译中技术社区

本文汇总了掘金翻译计划(Gold-miner)项目的各类学习资源,包括官方指南、文章列表、GitHub仓库等,帮助读者快速了解和参与这个优秀的开源翻译项目。

掘金翻译计划人工智能区块链Android前端Github开源项目热门
Quivr入门指南 - 基于生成式AI的开源第二大脑框架

Quivr入门指南 - 基于生成式AI的开源第二大脑框架

Quivr是一个强大的开源RAG框架,用于构建基于生成式AI的第二大脑。本文介绍了Quivr的主要功能、安装步骤和使用方法,帮助读者快速上手这个智能助手工具。

QuivrGenerativeAI开源个人助理数据安全Github开源项目热门
MockingBird项目学习资料汇总 - AI克隆声音5秒生成任意语音

MockingBird项目学习资料汇总 - AI克隆声音5秒生成任意语音

MockingBird是一个基于深度学习的声音克隆和语音合成项目。本文汇总了该项目的学习资料,包括官方文档、教程视频、模型下载等,帮助读者快速入门和深入学习这一有趣的AI语音技术。

PyTorchMockingBird中文支持音频合成训练模型Github开源项目热门
lobe-chat入门指南 - 开源AI聊天助手框架

lobe-chat入门指南 - 开源AI聊天助手框架

lobe-chat是一个开源的、现代设计的AI聊天框架,支持多种AI提供商、知识库、多模态交互和插件系统。本文汇总了lobe-chat的主要功能和学习资源,帮助用户快速上手使用这个强大的AI助手工具。

LobeChat多模态对话开源聊天框架人工智能插件系统Github开源项目热门
AutoGPT: 实现所有人可用可构建的AI愿景

AutoGPT: 实现所有人可用可构建的AI愿景

AutoGPT是一个开源项目,旨在实现所有人都能使用和构建的AI愿景。项目的使命是提供工具,让用户能专注于重要的事情。

AutoGPT智能代理GitHubAI前端Github开源项目热门
funNLP - 中文自然语言处理资源宝库 - 几乎最全的中文NLP工具资源集合

funNLP - 中文自然语言处理资源宝库 - 几乎最全的中文NLP工具资源集合

funNLP是一个集合了大量中文自然语言处理相关资源的开源项目,包括语料库、词库、预训练模型、各类NLP任务工具等,堪称中文NLP资源的"百宝箱",是NLP入门和进阶的优质资料库。

NLP民工的乐园中文NLP资源库类ChatGPT模型LLM训练推理文本生成Github开源项目热门