深度学习最佳AI工具集合:网站、应用和开源项目

2_rectified_flow_from_sd_1_5

2_rectified_flow_from_sd_1_5

Huggingface模型

基于Stable Diffusion微调的快速文本生成图像模型

MoE-LLaVA-Phi2-2.7B-4e

MoE-LLaVA-Phi2-2.7B-4e

视觉语言模型MoE-LLaVA

MoE-LLaVA模型应用专家混合系统提升视觉语言能力

herbert-base-cased

herbert-base-cased

预训练语言模型模型

波兰语自然语言处理的新突破:HerBERT预训练模型

volo_d1_224.sail_in1k

volo_d1_224.sail_in1k

VOLO模型

VOLO D1 224模型 基于ImageNet-1k训练的视觉识别工具

tinynet_a.in1k

tinynet_a.in1k

ImageNet模型

轻量级图像分类模型 TinyNet 实现高效特征提取

res2next50.in1k

res2next50.in1k

特征提取Huggingface

基于Res2Net架构的高效多尺度图像分类模型

ghostnet_100.in1k

ghostnet_100.in1k

模型图像分类

GhostNet轻量级图像分类模型实现高效特征提取

flux-controlnet-collections

flux-controlnet-collections

图像生成Huggingface

FLUX.1-dev专用ControlNet模型集合优化图像生成控制

donut-base

donut-base

计算机视觉Huggingface

Donut模型:革新文档理解的图像到文本AI技术

cspdarknet53.ra_in1k

cspdarknet53.ra_in1k

CSPDarkNetHuggingface

CSP-DarkNet架构的图像分类和特征提取模型

segformer-b5-finetuned-ade-640-640

segformer-b5-finetuned-ade-640-640

语义分割Transformer

SegFormer-b5模型用于ADE20k数据集的语义分割

IF-I-M-v1.0

IF-I-M-v1.0

Huggingface模型

DeepFloyd-IF像素级文本到图像级联扩散模型

wav2vec2-lg-xlsr-en-speech-emotion-recognition

wav2vec2-lg-xlsr-en-speech-emotion-recognition

微调模型

微调Wav2Vec 2.0实现高精度语音情感识别

sd-vae-ft-mse

sd-vae-ft-mse

模型模型微调

改进稳定扩散自编码器提升图像重建效果

GLaMM-GranD-Pretrained

GLaMM-GranD-Pretrained

模型计算机视觉

基于GranD数据集的区域级理解和分割预训练模型

pythia-410m

pythia-410m

语言模型模型

专为自然语言处理研究设计的中型预训练语言模型

llama-160m-accelerator

llama-160m-accelerator

模型开源项目

基于多阶段MLP的LLaMA-160M模型推理加速器

ddpm-cifar10-32

ddpm-cifar10-32

图像生成Huggingface

扩散概率模型在CIFAR10数据集上的图像生成应用

FLUX.1-dev-ControlNet-Union-Pro

FLUX.1-dev-ControlNet-Union-Pro

模型图像生成

FLUX.1-dev系列七模式控制网络模型助力高级图像生成

trocr-small-printed

trocr-small-printed

模型光学字符识别

基于Transformer的印刷文本OCR模型