最佳Github AI工具与开源项目集锦

Qwen2-7B-Instruct

Qwen2-7B-Instruct

模型Qwen2

开源大语言模型支持13万token超长上下文处理

surya_rec2

surya_rec2

模型Surya

Surya项目专用的光学字符识别模型

deberta-large

deberta-large

语言模型Huggingface

DeBERTa模型利用解耦注意力机制提升自然语言理解能力

wav2vec2-base

wav2vec2-base

模型自监督学习

Facebook开发的语音表征学习模型实现低资源语音识别

trocr-small-handwritten

trocr-small-handwritten

TrOCRHuggingface

Transformer架构的手写文本识别OCR模型

prot_t5_xl_uniref50

prot_t5_xl_uniref50

模型Github

基于T5架构的大规模蛋白质序列预训练模型

creative-writing-control-vectors-v3.0

creative-writing-control-vectors-v3.0

模型GGUF

创意写作控制向量助力语言模型精准生成

vit-large-patch32-384

vit-large-patch32-384

模型Github

基于Transformer架构的大规模图像分类模型

Juggernaut-XL-v9

Juggernaut-XL-v9

模型模型训练

融合多种摄影风格的AI图像生成模型

t5-v1_1-xl

t5-v1_1-xl

Huggingface模型

Google T5-v1_1-xl:优化的大规模预训练语言模型

Qwen1.5-1.8B

Qwen1.5-1.8B

Huggingface模型

多语言大规模语言模型支持32K上下文长度

DeepSeek-Coder-V2-Instruct

DeepSeek-Coder-V2-Instruct

模型大型语言模型

高性能开源MoE代码语言模型支持338种编程语言

mt5-large

mt5-large

模型mT5

多语言文本转换模型支持101种语言处理

wav2vec2-large-xlsr-53-polish

wav2vec2-large-xlsr-53-polish

模型Common Voice

基于XLSR-53的波兰语语音识别模型

nllb-200-distilled-600M

nllb-200-distilled-600M

机器翻译Huggingface

NLLB-200:支持200种语言互译的开源机器翻译模型

animagine-xl-3.1

animagine-xl-3.1

动漫风格人工智能绘图

开源动漫风格AI图像生成模型

detr-doc-table-detection

detr-doc-table-detection

Huggingface模型

基于DETR模型的文档表格智能识别系统

bert-mini-finetune-question-detection

bert-mini-finetune-question-detection

查询分类Kaggle

BERT-mini模型实现关键词与问题查询的精准分类

Qwen2.5-0.5B-Instruct

Qwen2.5-0.5B-Instruct

模型Qwen2.5

轻量级多语言指令模型Qwen2.5-0.5B

stsb-xlm-r-multilingual

stsb-xlm-r-multilingual

模型向量嵌入

基于XLM-RoBERTa的多语言句子嵌入模型