深度学习最佳AI工具集合:网站、应用和开源项目

resnet-152

resnet-152

图像识别ResNet-152

深入解析ResNet-152在图像分类中的应用

timesformer-base-finetuned-k600

timesformer-base-finetuned-k600

Kinetics-600TimeSformer

采用空间时间注意力的视频分类技术,提升视频理解能力

yolov10x

yolov10x

深度学习Github

高效的实时端到端物体检测工具

wav2vec2-large-xlsr-53-german

wav2vec2-large-xlsr-53-german

Common VoiceWav2Vec2

优化德语自动语音识别的开源模型

tf_mobilenetv3_large_075.in1k

tf_mobilenetv3_large_075.in1k

开源项目模型

MobileNet-v3大规模图像分类与特征提取模型

t2i-adapter-canny-sdxl-1.0

t2i-adapter-canny-sdxl-1.0

稳定扩散图像生成

T2I适配器结合Canny检测提升稳定扩散XL的条件控制

LDCC-SOLAR-10.7B

LDCC-SOLAR-10.7B

SOLAR论文深度学习

基于SOLAR方法的深度学习模型,应用于数据通信与工程

albert-xxlarge-v1

albert-xxlarge-v1

机器学习Github

大型英文数据集上的预训练语言模型

wav2vec2_tiny_random

wav2vec2_tiny_random

深度学习Huggingface

轻量级语音识别模型测试入门

SaProt_650M_PDB

SaProt_650M_PDB

SaProtesm

提供两种加载方式以支持深度学习蛋白质模型的灵活使用

Chip_n_DallE

Chip_n_DallE

深度学习合成模型

细致化的文本到图像生成模型

sam2-hiera-tiny

sam2-hiera-tiny

视觉分割SAM 2

提供图像和视频分割功能的开放源码基础模型

PixArt-XL-2-512x512

PixArt-XL-2-512x512

Pixart-αGithub

快速生成高分辨率图像的高效能模型

yolov8s-table-extraction

yolov8s-table-extraction

目标检测Github

基于YoloV8的表格检测与提取模型

MiniCPM-V-2

MiniCPM-V-2

场景文本理解MiniCPM-V

多模态语言模型,支持跨平台高效部署

Infinity-Instruct-3M-0625-Yi-1.5-9B

Infinity-Instruct-3M-0625-Yi-1.5-9B

无强化学习模型训练

大规模指令调优模型无需人类反馈的创新

control_v11p_sd15_normalbae

control_v11p_sd15_normalbae

ControlNetGithub

了解ControlNet v1.1的条件扩展功能如何提高文本到图像生成质量

taef1

taef1

TAEF1开源项目

高效微型自动编码器增强FLUX.1实时预览

dart-v1-sft

dart-v1-sft

transformers标签生成

优化Danbooru标注生成的Transformer模型

convnextv2_nano.fcmae_ft_in1k

convnextv2_nano.fcmae_ft_in1k

Github开源项目

基于FCMAE的ConvNeXt-V2高效图像分类与特征提取模型