最佳Github AI工具与开源项目集锦

tf_efficientnetv2_s.in21k

tf_efficientnetv2_s.in21k

模型图像分类

EfficientNetV2图像分类模型 支持多种计算机视觉应用

vivit-b-16x2-kinetics400

vivit-b-16x2-kinetics400

模型Github

ViViT 扩展Vision Transformer至视频分析领域的创新模型

splade-v3

splade-v3

模型文本检索

SPLADE-v3稀疏神经信息检索模型的最新进展

lcnet_050.ra2_in1k

lcnet_050.ra2_in1k

LCNet特征提取

LCNet轻量级神经网络模型实现高效图像分类和特征提取

nougat-base

nougat-base

HuggingfacePDF转Markdown

神经网络模型实现科学PDF文档到Markdown的智能转换

bart-large

bart-large

模型seq2seq

用于自然语言生成和理解的预训练序列到序列模型

convnext_base.fb_in22k_ft_in1k

convnext_base.fb_in22k_ft_in1k

Huggingface图像分类

ConvNeXt图像分类模型:ImageNet-22k预训练和ImageNet-1k微调

all-MiniLM-L6-v2

all-MiniLM-L6-v2

特征提取Huggingface

轻量级句子嵌入模型助力Web环境文本分析

DFN5B-CLIP-ViT-H-14

DFN5B-CLIP-ViT-H-14

CLIP模型

高性能图像-文本对比学习模型

seamless-m4t-v2-large

seamless-m4t-v2-large

Huggingface模型

跨语言跨模态机器翻译新里程碑

t5-base-tag-generation

t5-base-tag-generation

模型Github

T5模型微调实现自动文章标签生成

CuteCartoonRedmond-V2

CuteCartoonRedmond-V2

AI绘图卡通风格

基于SD XL 1.0的卡通角色生成LORA模型

Qwen1.5-0.5B-Chat-GGUF

Qwen1.5-0.5B-Chat-GGUF

模型开源项目

基于通义千问1.5的轻量级中文对话模型

Llama-3.2-1B-Instruct-GGUF

Llama-3.2-1B-Instruct-GGUF

语言模型模型

Llama 3.2模型的多精度量化版本

byt5-xl

byt5-xl

模型Github

基于原始字节的多语言自然语言处理模型

bert-base

bert-base

语言模型Huggingface

KLUE BERT base为韩语自然语言处理提供强大支持

w2v-bert-2.0

w2v-bert-2.0

模型W2v-BERT 2.0

大规模多语言语音编码器

faster-distil-whisper-medium.en

faster-distil-whisper-medium.en

模型faster-whisper

基于CTranslate2的Whisper medium.en模型语音识别工具

t5-v1_1-base

t5-v1_1-base

Huggingface模型

Google T5模型的改进版本 专注于文本到文本的转换任务

wav2vec2-large-xlsr-53-spanish

wav2vec2-large-xlsr-53-spanish

模型西班牙语

基于XLSR-53微调的西班牙语语音识别模型