最佳Github AI工具与开源项目集锦

paraphrase-multilingual-mpnet-base-v2

paraphrase-multilingual-mpnet-base-v2

模型Github

跨语言句子向量化模型支持聚类和语义检索

finbert

finbert

ProsusHuggingface

针对金融领域的BERT情感分析预训练模型

bart-base

bart-base

模型Github

用于自然语言生成和理解的序列到序列预训练模型

Llama-3.2-11B-Vision-Instruct

Llama-3.2-11B-Vision-Instruct

Llama 3.2-Vision图像识别

Meta开发的多模态语言模型 提供图像理解与文本生成

xlm-roberta-base-language-detection

xlm-roberta-base-language-detection

模型Github

多语言文本自动识别模型

vit-gpt2-image-captioning

vit-gpt2-image-captioning

模型计算机视觉

ViT-GPT2结合的智能图像描述生成模型

colbertv2.0

colbertv2.0

向量检索模型

基于BERT的大规模文本快速检索模型

ms-marco-MiniLM-L-6-v2

ms-marco-MiniLM-L-6-v2

Cross-Encoder模型

高性能跨编码器模型用于信息检索和文本排序

bge-large-en-v1.5

bge-large-en-v1.5

模型Github

高性能英语嵌入模型助力文本相似度和信息检索

XTTS-v2

XTTS-v2

Coqui模型

多语言语音克隆与生成的开源解决方案

bart-large-mnli

bart-large-mnli

零样本分类模型

基于BART的NLI模型实现零样本多领域文本分类

stable-diffusion-inpainting

stable-diffusion-inpainting

文本转图像AI绘画

开源AI模型实现图像修复和高质量生成

AST-VoxCelebSpoof-Synthetic-Voice-Detection

AST-VoxCelebSpoof-Synthetic-Voice-Detection

ASTHuggingface

AST模型实现超高精度合成语音识别

dinov2-base

dinov2-base

特征提取图像处理

基于Vision Transformer的自监督视觉特征学习模型

bert-large-uncased

bert-large-uncased

Huggingface模型

大规模无大小写区分BERT自然语言处理预训练模型

bert-large-cased

bert-large-cased

模型文本分类

大规模双向Transformer预训练英语语言模型

parrot_paraphraser_on_T5

parrot_paraphraser_on_T5

改写自然语言理解

Parrot:多功能文本复述框架优化NLU训练

mms-1b-all

mms-1b-all

多语言语音Huggingface

大规模多语言语音识别模型支持超1100种语言

e5-large-v2

e5-large-v2

Sentence TransformersHuggingface

多语言文本任务的高性能句子嵌入模型

wav2vec2-base-960h

wav2vec2-base-960h

模型Github

Facebook开发的高效语音识别模型