最佳Github AI工具与开源项目集锦

QAnything

QAnything知识库问答系统

多格式文件支持的本地知识库智能问答系统

VoiceCraft

VoiceCraft语音编辑

实现零样本语音编辑和实时文本转语音的革命性技术

llm.c

LLMC语言

纯C和CUDA实现的高效轻量级语言模型训练框架

Vim

Vision Mamba视觉表示学习

基于双向状态空间模型的高效视觉表示学习

gpt-fast

gpt-fastPyTorch

PyTorch原生高效文本生成项目

pykan

KAN神经网络

实现了Kolmogorov-Arnold网络，提升神经网络准确性和可解释性

AcademiCodec

AcademiCodec音频编解码

开源音频编解码工具包推动学术创新

ReazonSpeech

ReazonSpeech语音识别

多模型语音识别开源工具包支持日语音频分析

big_vision

big vision深度学习

基于Jax/Flax的大规模视觉模型训练框架

speech-resynthesis

语音重合成自监督学习

基于离散解耦自监督表示的语音重合成技术

3D-Speaker

说话人验证开源工具包

开源多模态说话人识别与验证工具包

espnet_onnx

espnet_onnxONNX

轻量级语音识别和合成库基于ONNX格式优化

GPT-SoVITS-Server

GPT-SoVITS语音克隆

轻量级语音克隆模型部署工具

CapsWriter-Offline

CapsWriter-Offline语音输入

多功能离线语音识别和字幕转录软件

aTrain

aTrain语音转录

本地化多语言语音转录工具支持主流质性分析软件

ChatTTS_Speaker

ChatTTS音色评分

AI语音合成稳定性评估与特征标记工具

Rin

Rin博客系统

基于Cloudflare的无服务器博客解决方案

TTSlist

chatTTS音色库

多样化中文AI音色资源库简化语音合成选择

OpenCC

OpenCC中文转换

开源中文简繁转换系统支持多语言接口

ip2region

ip2regionIP地址定位

快速精准的IP地址定位与管理解决方案

848 849 850 851 852

探索AI的无限可能

访问

AI工具导航精选AI信息

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com