值得探索的AI开源项目:工具、网站与应用合集

tapas-tiny-finetuned-sqa

tapas-tiny-finetuned-sqa

TAPAS语义分析

TAPAS表格问答模型实现多轮对话式表格数据查询

one-align

one-align

图像质量评估图像美学评估

整合图像和视频质量评估的多功能AI模型

whisper-large-v3-turbo

whisper-large-v3-turbo

自动语音识别语音识别

精简版Whisper语音识别系统的突破性进展

sd-image-variations-diffusers

sd-image-variations-diffusers

图像变体Stable Diffusion

基于Stable Diffusion的开源图像变体生成模型

vit_base_patch32_clip_448.laion2b_ft_in12k_in1k

vit_base_patch32_clip_448.laion2b_ft_in12k_in1k

ImageNetGithub

LAION-2B预训练的ViT图像分类模型

sdxl-instructpix2pix-768

sdxl-instructpix2pix-768

深度学习Github

基于SDXL的指令式图像编辑模型

Noromaid-13B-v0.3-GGUF

Noromaid-13B-v0.3-GGUF

NoromaidGithub

高效本地部署的大规模语言模型GGUF量化版本,支持多种精度选项

qinglong_controlnet-lllite

qinglong_controlnet-lllite

ControlNet-LLLite深度学习

轻量级动漫图像控制模型集成多种处理功能

DeepSeek-V2-Lite-Chat

DeepSeek-V2-Lite-Chat

开源项目深度学习

单卡40G部署的轻量级混合专家语言模型

moirai-1.0-R-base

moirai-1.0-R-base

时间序列预测开源项目

基于Transformer的通用时间序列预测模型

stable-diffusion-3-medium-GGUF

stable-diffusion-3-medium-GGUF

stable-diffusion-3Huggingface

高性能GGUF格式量化模型集合,支持多种精度的文生图应用

mit-b1

mit-b1

机器学习图像分割

SegFormer分层Transformer编码器用于语义分割

openchat-3.5-0106

openchat-3.5-0106

语言模型开源项目

基于Mistral的7B开源语言模型在多项测试中超越大型模型

simplevectorflux

simplevectorflux

FluxLoRA模型

基于Flux.1开发的简约矢量风格插画LoRA模型

opus-mt-th-en

opus-mt-th-en

Thai模型

开源泰英机器翻译模型实现48.1 BLEU评分

gemma-2-2b-jpn-it-gguf

gemma-2-2b-jpn-it-gguf

日语语言模型llama.cpp

基于Gemma的日语大模型跨平台量化部署版

Qwen2.5-14B

Qwen2.5-14B

Qwen2.5Github

基于transformer架构的多语言预训练模型 具备超长文本理解能力

finbert-fls

finbert-fls

文本分类Forward-looking statement

智能金融文本分析工具助力投资决策高效优化

oneformer_ade20k_swin_tiny

oneformer_ade20k_swin_tiny

图像分割实例分割

通过单一模型实现多任务图像分割的统一框架

wav2vec2-large-xlsr-53-french

wav2vec2-large-xlsr-53-french

开源项目模型

法语语音识别模型实现自动语音文本转录