最佳Github AI工具与开源项目集锦

vit_large_patch16_224.augreg_in21k_ft_in1k

vit_large_patch16_224.augreg_in21k_ft_in1k

ImageNet模型

预训练ViT大模型实现高性能图像分类与特征提取

CodeLlama-7b-Instruct-hf

CodeLlama-7b-Instruct-hf

模型模型训练

Meta开发的7B参数通用代码生成模型 支持代码补全和指令跟随

Llama-3.2-3B-Instruct-uncensored-GGUF

Llama-3.2-3B-Instruct-uncensored-GGUF

模型量化

3B参数指令微调语言模型的高效GGUF量化版本

levit_128.fb_dist_in1k

levit_128.fb_dist_in1k

LeViT开源项目

LeViT-128 轻量级卷积视觉Transformer实现快速图像分类

bertweet-base

bertweet-base

Huggingface模型

BERTweet为英文推文提供预训练大规模语言模型

rubert-base-cased-russian-sentiment

rubert-base-cased-russian-sentiment

模型情感分析

基于RuBERT的俄语短文本情感分析模型

deberta-v3-base-tasksource-nli

deberta-v3-base-tasksource-nli

模型多任务学习

DeBERTa-v3多任务学习模型用于零样本分类与推理

gtr-t5-large

gtr-t5-large

T5模型模型

基于T5-large的语义搜索模型 实现句子到768维向量的映射

flan-t5-3b-summarizer

flan-t5-3b-summarizer

模型多任务学习

基于FLAN-T5的多领域文本摘要模型

trocr-large-handwritten

trocr-large-handwritten

模型图像文字识别

TrOCR:大规模预训练的手写文本识别模型

cogvlm-chat-hf

cogvlm-chat-hf

模型开源

开源视觉语言模型CogVLM在多项跨模态基准测试中超越PaLI-X 55B

gmlp_s16_224.ra3_in1k

gmlp_s16_224.ra3_in1k

ImageNet模型

gMLP架构的ImageNet-1k图像分类模型

chronos-t5-large

chronos-t5-large

语言模型时间序列预测

基于T5架构的大规模时间序列预测模型

Mixtral-8x7B-v0.1

Mixtral-8x7B-v0.1

模型优化Mixtral-8x7B

多语言预训练大语言模型 超越Llama 2 70B性能

res2net50_14w_8s.in1k

res2net50_14w_8s.in1k

模型开源项目

Res2Net架构的多尺度骨干网络实现高效图像分类

rexnet_100.nav_in1k

rexnet_100.nav_in1k

模型图像分类

轻量级ReXNet图像分类模型 为资源受限场景提供高效解决方案

Florence-2-large-ft

Florence-2-large-ft

图像识别计算机视觉

统一表示实现多种视觉任务的AI基础模型

Qwen2.5-Coder-7B-Instruct

Qwen2.5-Coder-7B-Instruct

模型大型语言模型

卓越代码生成能力和128K长文本支持

MiniCPM-Llama3-V-2_5

MiniCPM-Llama3-V-2_5

Huggingface模型

手机端多模态大语言模型突破性进展:8B参数达GPT-4V水平

volo_d1_224.sail_in1k

volo_d1_224.sail_in1k

VOLO模型

VOLO D1 224模型 基于ImageNet-1k训练的视觉识别工具