深度学习最佳AI工具集合:网站、应用和开源项目

ProteusV0.3

ProteusV0.3

anime图像生成

融合动漫与写实风格的AI图像生成模型

mask2former-swin-base-coco-panoptic

mask2former-swin-base-coco-panoptic

语义分割计算机视觉

多任务图像分割的先进模型

tokenizer_titok_s128_imagenet

tokenizer_titok_s128_imagenet

Huggingface模型

基于PytorchModelHubMixin的开源图像标记化模型

TimeMoE-50M

TimeMoE-50M

模型开源项目

混合专家时间序列预测基础模型 提升大规模数据分析能力

vitmatte-base-composition-1k

vitmatte-base-composition-1k

计算机视觉Huggingface

Vision Transformer驱动的图像抠图模型

Qwen2-0.5B-Instruct

Qwen2-0.5B-Instruct

模型Github

轻量级高性能指令对话模型 提升自然语言处理能力

wav2vec2-large-xlsr-53-gender-recognition-librispeech

wav2vec2-large-xlsr-53-gender-recognition-librispeech

模型Librispeech

Wav2Vec2模型在Librispeech数据集上的音频性别识别应用

vram-48

vram-48

模型Github

专为大规模语言模型设计的推理优化框架

trocr-large-printed

trocr-large-printed

光学字符识别模型

基于Transformer的大规模印刷文本OCR模型

food-category-classification-v2.0

food-category-classification-v2.0

模型开源项目

12类食品图像分类模型 准确率达96%

dpr-question_encoder-multiset-base

dpr-question_encoder-multiset-base

DPRHuggingface

多数据集训练的DPR问题编码器助力开放域问答

gpt-neo-2.7B

gpt-neo-2.7B

模型Github

EleutherAI开发的27亿参数GPT-Neo语言模型展现多任务处理能力

vram-80

vram-80

transformersHuggingface

优化大型语言模型微调的开源工具

stable-diffusion-v1-5

stable-diffusion-v1-5

模型开源项目

先进的文本到图像生成模型,实现高质量图像创作

efficientnet_lite0.ra_in1k

efficientnet_lite0.ra_in1k

ImageNet模型

轻量级EfficientNet模型用于图像分类和特征提取

edsr-base

edsr-base

模型DIV2K

轻量级单图像超分辨率深度残差网络

MedCPT-Cross-Encoder

MedCPT-Cross-Encoder

模型Github

基于PubMed数据的医学文献智能排序模型

fullstop-punctuation-multilang-large

fullstop-punctuation-multilang-large

模型多语言模型

多语言深度学习模型为文本自动恢复标点符号

DNABERT-2-117M

DNABERT-2-117M

模型生物学

多物种基因组分析的先进Transformer模型

gpt-neo-125m

gpt-neo-125m

文本生成EleutherAI

轻量级自然语言生成模型