最佳Github AI工具与开源项目集锦

trocr-base-printed

trocr-base-printed

TrOCRHuggingface

基于Transformer的OCR模型 专注印刷文本识别

opus-mt-pl-en

opus-mt-pl-en

模型机器翻译

基于OPUS数据集的波兰语-英语机器翻译模型

Qwen2-Math-7B-Instruct

Qwen2-Math-7B-Instruct

指令模型Huggingface

专注数学推理的大型语言模型

ToolACE-8B

ToolACE-8B

模型函数调用

在工具调用性能上与GPT-4旗鼓相当的开源语言模型

Depth-Anything-V2-Base-hf

Depth-Anything-V2-Base-hf

图像处理计算机视觉

高效精细的单目深度估计模型 提供稳健性能

byt5-large

byt5-large

字节级处理Huggingface

字节级多语言自然语言处理模型

Kolors-diffusers

Kolors-diffusers

KolorsHuggingface

基于扩散模型的高质量文本到图像生成技术

gte-Qwen2-1.5B-instruct

gte-Qwen2-1.5B-instruct

模型Github

先进语言模型在MTEB多任务评估中的优异成绩

indonesian-roberta-base-sentiment-classifier

indonesian-roberta-base-sentiment-classifier

模型情感分析

印尼语RoBERTa情感分类器:高精度的开源NLP工具

vit_base_patch16_224.dino

vit_base_patch16_224.dino

DINO模型

自监督训练的ViT模型实现高效图像特征提取

Mistral-7B-Instruct-v0.3-GGUF

Mistral-7B-Instruct-v0.3-GGUF

提示模板模型

高性能量化版指令微调大语言模型

faster-whisper-small.en

faster-whisper-small.en

faster-whisperWhisper

基于CTranslate2的Whisper小型英语音频转写模型

tf_mixnet_l.in1k

tf_mixnet_l.in1k

PyTorch模型

MixNet架构的轻量级图像分类模型

resnet-152-text-detector

resnet-152-text-detector

文本检测计算机视觉

基于ResNet-152的高效图像文本检测深度学习模型

dreamshaper-8

dreamshaper-8

Huggingface模型

基于Stable Diffusion的多风格AI图像生成模型

Llama-3.2-3B-Instruct-Q8_0-GGUF

Llama-3.2-3B-Instruct-Q8_0-GGUF

语言模型模型

Llama 3.2系列8位量化指令型语言模型

Llama-3.2-1B-Instruct-GGUF

Llama-3.2-1B-Instruct-GGUF

模型模型训练

Llama 3.2语言模型微调加速与优化工具

xcit_large_24_p8_224.fb_in1k

xcit_large_24_p8_224.fb_in1k

ImageNet模型

XCiT大型模型提供强大的图像分类和特征提取能力

specter2_aug2023refresh_base

specter2_aug2023refresh_base

模型SPECTER2

基于引用关系的科学文献嵌入模型

twins_pcpvt_base.in1k

twins_pcpvt_base.in1k

Huggingface图像分类

Twins-PCPVT基础模型在ImageNet-1k上的图像分类应用