最佳Github AI工具与开源项目集锦

Juggernaut-XL-v6

Juggernaut-XL-v6

AI绘图模型

多功能SDXL图像生成模型 支持艺术和摄影创作

dinov2-small

dinov2-small

计算机视觉DINOv2

小型Vision Transformer模型用于无监督视觉特征学习

GOT-OCR2_0

GOT-OCR2_0

OCR视觉语言模型

GOT-OCR2_0为OCR技术开创统一端到端模型新纪元

playground-v2.5-1024px-aesthetic

playground-v2.5-1024px-aesthetic

模型Playground v2.5

突破性的高质量图像生成模型

Llama-3.2-3B

Llama-3.2-3B

模型多语言

Meta推出Llama 3.2多语言大型语言模型系列

vit_tiny_patch16_384.augreg_in21k_ft_in1k

vit_tiny_patch16_384.augreg_in21k_ft_in1k

ImageNet模型

ViT-Tiny 轻量级视觉转换器模型实现图像分类与特征提取

layoutlmv3-large

layoutlmv3-large

模型开源项目

统一文本和图像掩码的文档AI预训练模型

mistral-nemo-instruct-2407-awq

mistral-nemo-instruct-2407-awq

模型Github

Mistral-Nemo-Instruct-2407模型的AWQ量化指令版本

OpenSora-STDiT-v3

OpenSora-STDiT-v3

模型模型权重

STDiT-v3模型实现开源视频生成和编辑功能

bert-base-turkish-cased-mean-nli-stsb-tr

bert-base-turkish-cased-mean-nli-stsb-tr

模型Github

BERT模型在土耳其语句子相似度任务中的应用

gemma-2-27b-it

gemma-2-27b-it

模型Github

Google开源的27B参数大语言模型 支持多种文本生成应用

parakeet-rnnt-0.6b

parakeet-rnnt-0.6b

模型Transducer

先进的英语语音识别模型 准确率达98.37%

owlvit-base-patch32

owlvit-base-patch32

模型目标检测

OWL-ViT:基于CLIP的开放词汇目标检测模型

opt-350m

opt-350m

模型Github

Meta AI开发的开源预训练Transformer语言模型

faster-whisper-large-v2

faster-whisper-large-v2

模型Whisper

多语言语音识别模型 支持高效转录和翻译

blip-vqa-base

blip-vqa-base

Huggingface模型

BLIP视觉语言预训练模型实现理解与生成双重任务

opus-mt-en-de

opus-mt-en-de

机器翻译Huggingface

赫尔辛基大学开发的英德神经机器翻译模型

llama-160m

llama-160m

模型模型训练

160M参数的轻量级LLaMA模型用于快速文本生成

nli-deberta-v3-base

nli-deberta-v3-base

Cross-EncoderDeBERTa

基于DeBERTa-v3的自然语言推理模型

chinese-bert-wwm-ext

chinese-bert-wwm-ext

模型BERT

全词掩码中文BERT模型加速自然语言处理