深度学习最佳AI工具集合:网站、应用和开源项目

LaBSE-en-ru

LaBSE-en-ru

模型Github

精简优化的英俄双语句向量模型

ner-english

ner-english

模型Github

Flair框架英语命名实体识别模型 准确率93%

segformer-b0-finetuned-ade-512-512

segformer-b0-finetuned-ade-512-512

模型Github

SegFormer-b0模型实现高效语义分割

segformer-b1-finetuned-ade-512-512

segformer-b1-finetuned-ade-512-512

模型语义分割

SegFormer-b1在ADE20k数据集上微调的语义分割模型

swinv2-tiny-patch4-window16-256

swinv2-tiny-patch4-window16-256

模型Github

Swin Transformer v2:分层特征图构建的高效视觉模型

vram-16

vram-16

模型Github

低内存高效的视觉语言模型

wav2vec2-base

wav2vec2-base

模型自监督学习

Facebook开发的语音表征学习模型实现低资源语音识别

vit-large-patch32-384

vit-large-patch32-384

模型Github

基于Transformer架构的大规模图像分类模型

detr-doc-table-detection

detr-doc-table-detection

Huggingface模型

基于DETR模型的文档表格智能识别系统

efficientnet_b3.ra2_in1k

efficientnet_b3.ra2_in1k

模型预训练模型

EfficientNet B3变体:基于RandAugment的ImageNet-1k图像分类模型

ViT-L-16-SigLIP-384

ViT-L-16-SigLIP-384

SigLIP计算机视觉

基于SigLIP的先进视觉语言模型实现零样本图像分类

mdeberta-v3-base

mdeberta-v3-base

Huggingface模型

DeBERTa V3架构多语言模型助力跨语言NLU任务

stable-diffusion-2-1-base-custom

stable-diffusion-2-1-base-custom

图像生成Huggingface

基于Stable Diffusion 2.1的自定义扩散模型用于图像生成

IP-Adapter-FaceID

IP-Adapter-FaceID

模型人脸识别

基于面部ID的多风格人像生成技术

GIST-all-MiniLM-L6-v2

GIST-all-MiniLM-L6-v2

模型评估文本相似度

多语言句子相似度和特征提取模型

jina-embeddings-v2-small-en

jina-embeddings-v2-small-en

模型Github

英文句子嵌入模型用于多种自然语言处理任务

Mistral-7B-v0.1

Mistral-7B-v0.1

文本生成Huggingface

超越Llama 2的开源大语言模型

table-transformer-detection

table-transformer-detection

Table Transformer图像处理

Table Transformer:先进的文档表格检测模型

keyphrase-extraction-distilbert-inspec

keyphrase-extraction-distilbert-inspec

关键词提取Inspec数据集

DistilBERT驱动的科学文献关键短语提取模型

mbart-large-50-many-to-many-mmt

mbart-large-50-many-to-many-mmt

多语言机器翻译Github

mBART-50多语言机器翻译模型实现50种语言直接互译