深度学习最佳AI工具集合:网站、应用和开源项目

upos-english

upos-english

模型Github

Flair框架英语词性标注模型 实现98.6% F1分数

jina-bert-flash-implementation

jina-bert-flash-implementation

模型模型配置

将BERT与Flash-Attention结合的高效模型实现

gpt2-xl

gpt2-xl

Huggingface模型

OpenAI开发的15亿参数GPT-2 XL语言模型

pnasnet5large.tf_in1k

pnasnet5large.tf_in1k

模型PNasNet

PNASNet大规模图像分类与特征提取模型

crossvit_9_240.in1k

crossvit_9_240.in1k

Huggingface图像分类

跨注意力多尺度视觉Transformer图像分类模型

convmixer_768_32.in1k

convmixer_768_32.in1k

卷积神经网络模型

ConvMixer架构的高效图像分类与特征提取模型

convit_base.fb_in1k

convit_base.fb_in1k

ConViTHuggingface

ConViT架构图像分类模型在ImageNet-1k上的应用

LCM_Dreamshaper_v7

LCM_Dreamshaper_v7

图像生成Latent Consistency Models

基于潜在一致性模型的高效图像生成技术

eva_large_patch14_196.in22k_ft_in22k_in1k

eva_large_patch14_196.in22k_ft_in22k_in1k

模型神经网络

EVA大型图像分类模型适用于多种计算机视觉应用

sew-d-tiny-100k-ft-ls100h

sew-d-tiny-100k-ft-ls100h

模型Github

SEW-D架构语音识别模型实现性能与效率的优化平衡

vitmatte-small-composition-1k

vitmatte-small-composition-1k

模型图像抠图

Vision Transformer驱动的先进图像抠图模型

vram-40

vram-40

模型Transformers

优化Transformer模型的内存和性能实现

regnety_002.pycls_in1k

regnety_002.pycls_in1k

模型ImageNet-1k

轻量级RegNetY模型用于图像分类与特征提取

voice-gender-classifier

voice-gender-classifier

ECAPA-TDNNHuggingface

ECAPA-TDNN架构驱动的人声性别识别器

CodeLlama-7b-hf

CodeLlama-7b-hf

模型Github

基于7B参数的代码生成与理解模型

sentence-t5-xl

sentence-t5-xl

模型文本向量化

高维向量映射模型实现句子和段落的精确表示

wav2vec2-xls-r-300m-cs-250

wav2vec2-xls-r-300m-cs-250

模型模型训练

高性能捷克语语音识别模型 实现精准音频转文本

wav2vec2-large-xlsr-53

wav2vec2-large-xlsr-53

模型预训练模型

突破性多语言语音识别模型 适用低资源语言场景

lcm-lora-sdxl

lcm-lora-sdxl

模型SDXL

Stable Diffusion XL模型的低步数推理加速适配器

vit_base_patch16_384.augreg_in21k_ft_in1k

vit_base_patch16_384.augreg_in21k_ft_in1k

ImageNet模型

Vision Transformer用于图像分类和特征提取的先进模型