最佳Github AI工具与开源项目集锦

msmarco-MiniLM-L6-cos-v5

msmarco-MiniLM-L6-cos-v5

模型语义搜索

针对语义搜索的384维句子嵌入模型

encodec_32khz

encodec_32khz

音频编解码神经网络

神经网络驱动的实时音频编解码器

51-languages-classifier

51-languages-classifier

模型MASSIVE

多语言文本分类模型可精准识别51种语言

wav2vec2-large-xlsr-53-th

wav2vec2-large-xlsr-53-th

模型Common Voice

基于Common Voice数据集微调的泰语语音识别模型

LanguageBind_Video_merge

LanguageBind_Video_merge

模型多模态预训练

实现多模态与语言的语义对齐

CLIP-convnext_large_d_320.laion2B-s29B-b131K-ft-soup

CLIP-convnext_large_d_320.laion2B-s29B-b131K-ft-soup

模型零样本学习

ConvNeXt-Large CLIP模型提升零样本图像分类性能

gemma-2-9b

gemma-2-9b

模型人工智能

Google推出的轻量级开源大语言模型适用于资源有限环境

t5-11b

t5-11b

模型Github

统一框架下的多语言文本转换模型

Qwen2-1.5B-Instruct

Qwen2-1.5B-Instruct

模型Github

性能卓越的开源指令调优语言模型

wav2vec2-base-vi

wav2vec2-base-vi

模型Wav2Vec2

基于wav2vec2的越南语自监督学习模型提升语音识别性能

dpt-large

dpt-large

模型Github

基于视觉变换器的高精度单目深度估计模型

MiniLM-evidence-types

MiniLM-evidence-types

模型模型训练

MiniLM模型在证据类型分类任务上的应用与性能

vram-80

vram-80

transformersHuggingface

优化大型语言模型微调的开源工具

ClinicalBERT

ClinicalBERT

预训练语言模型模型

医疗领域专用BERT模型助力临床文本分析

Llama-3-8B-Instruct-DPO-v0.1-GGUF

Llama-3-8B-Instruct-DPO-v0.1-GGUF

文本生成Llama-3

Llama-3指令型语言模型的GGUF量化版本

robertuito-emotion-analysis

robertuito-emotion-analysis

模型Twitter

RoBERTuito驱动的西班牙语情感分析模型

vit_base_patch16_clip_224.openai

vit_base_patch16_clip_224.openai

CLIP模型

CLIP:跨模态视觉语言理解模型

distilbert-base-uncased-distilled-squad

distilbert-base-uncased-distilled-squad

Huggingface模型

DistilBERT轻量级问答模型

CLIP-ViT-L-14-DataComp.XL-s13B-b90K

CLIP-ViT-L-14-DataComp.XL-s13B-b90K

OpenCLIPCLIP

基于DataComp-1B数据集训练的零样本图像分类器

Yi-Coder-1.5B-Chat-GGUF

Yi-Coder-1.5B-Chat-GGUF

文本生成模型格式

高性能编程助手模型的GGUF量化版本