最佳Github AI工具与开源项目集锦

layoutlm-large-uncased

layoutlm-large-uncased

Huggingface模型

微软开发的多模态文档理解大型预训练模型

wav2vec2-large-es-voxpopuli

wav2vec2-large-es-voxpopuli

模型语音语料库

Wav2Vec2大型西班牙语语音识别模型基于VoxPopuli预训练

stable-diffusion-x4-upscaler

stable-diffusion-x4-upscaler

图像生成Huggingface

基于稳定扩散技术的AI图像4倍放大模型

Qwen2.5-7B-Instruct-bnb-4bit

Qwen2.5-7B-Instruct-bnb-4bit

transformersHuggingface

快速高效的大语言模型微调工具

tango-full

tango-full

模型生成式人工智能

基于扩散模型的高质量文本到音频生成工具

rubert-tiny2-russian-emotion-detection

rubert-tiny2-russian-emotion-detection

模型BERT

RuBERT-tiny2模型实现高精度俄语情感分析

pegasus_paraphrase

pegasus_paraphrase

模型Github

PEGASUS基于文本改写和释义模型

wav2vec2-conformer-rope-large-960h-ft

wav2vec2-conformer-rope-large-960h-ft

Huggingface模型

Wav2Vec2 Conformer模型在Librispeech数据集上的语音识别应用

vit_small_patch14_dinov2.lvd142m

vit_small_patch14_dinov2.lvd142m

模型图像分类

基于Vision Transformer的自监督图像特征提取模型

nb-whisper-large-beta

nb-whisper-large-beta

Huggingface模型

挪威国家图书馆开发的多语言语音识别模型NB-Whisper

paraphrase-albert-small-v2

paraphrase-albert-small-v2

MIT模型

基于ALBERT的轻量级句子相似度模型

nb-bert-base-ner

nb-bert-base-ner

模型BERT

挪威语BERT命名实体识别模型 适用NorNE数据集

vit-large-patch16-224-in21k

vit-large-patch16-224-in21k

模型计算机视觉

基于ImageNet-21k预训练的大型Vision Transformer模型

Llama-3.2-1B-bnb-4bit

Llama-3.2-1B-bnb-4bit

模型Llama 3.2

Llama-3.2-1B模型训练加速与内存优化工具

kogpt2-base-v2

kogpt2-base-v2

模型韩语模型

推动韩语自然语言处理的开源模型

Phi-3-medium-128k-instruct

Phi-3-medium-128k-instruct

语言模型Huggingface

14B参数轻量级开源大语言模型支持128K上下文

3d_render_style_xl

3d_render_style_xl

LoRAHuggingface

Stable Diffusion XL LoRA模型生成高质量3D渲染风格图像

mixtral-instruct-awq

mixtral-instruct-awq

AWQHuggingface

AWQ量化的Mixtral Instruct模型替代方案

UNI

UNI

图像处理Huggingface

病理学AI基础模型助力精准医疗诊断

Jamba-v0.1

Jamba-v0.1

模型开源项目

混合SSM-Transformer架构的高性能大语言模型