精选AI工具与开源项目:AI模型资源汇总

MobileLLM

MobileLLM

MobileLLM语言模型

轻量高效的移动设备语言模型

Awesome-Text-to-3D

Awesome-Text-to-3D

text-to-3D图像生成

前沿文本和图像到3D内容生成技术资源集

promptbase

promptbase

PromptbaseGPT-4

优化基础AI模型性能的开源资源库

VGen

VGen

VGen视频生成

多功能开源视频生成工具库

EchoMimic

EchoMimic

EchoMimic音频驱动

音频驱动的逼真人像动画系统 支持关键点编辑

Practical-RIFE

Practical-RIFE

RIFE视频插帧

开源视频插帧和增强框架

DeepSeek-Coder-V2

DeepSeek-Coder-V2

DeepSeek-Coder-V2MoE模型

开源代码语言模型

Latte

Latte

Latte视频生成

创新的潜在扩散Transformer视频生成技术

audioseal

audioseal

AudioSeal语音水印

创新语音水印技术 提升音频安全性能

segment-anything-2

segment-anything-2

SAM 2图像分割

新一代图像和视频分割基础模型

ttts

ttts

TTSVQVAE

创新多语言语音合成技术的突破性进展

audiocraft

audiocraft

AudioCraft音频生成

Facebook开源的AI音频生成工具库

llama-cpp-python

llama-cpp-python

llama.cppPython绑定

Python绑定库为LLM集成提供高效接口

openhermes-function-calling

openhermes-function-calling

OpenHermes函数调用

开源语言模型函数调用能力增强项目

insanely-fast-whisper

insanely-fast-whisper

Whisper语音转录

高效率开源语音转录命令行工具

Live2Diff

Live2Diff

Live2Diff视频翻译

革新视频扩散模型的实时流翻译技术

HierSpeechpp

HierSpeechpp

HierSpeech++语音合成

分层变分推理实现高质量零样本语音合成

seamless_communication

seamless_communication

SeamlessAI模型

AI多语言实时表情语音翻译系统

FastSAM

FastSAM

Fast Segment Anything图像分割

全景分割模型 速度提升50倍且性能可比SAM

EET

EET

EETTransformer

Transformer模型推理加速引擎