深度学习最佳AI工具集合：网站、应用和开源项目

resnet-152

图像识别ResNet-152

深入解析ResNet-152在图像分类中的应用

timesformer-base-finetuned-k600

Kinetics-600TimeSformer

采用空间时间注意力的视频分类技术，提升视频理解能力

yolov10x

深度学习Github

高效的实时端到端物体检测工具

wav2vec2-large-xlsr-53-german

Common VoiceWav2Vec2

优化德语自动语音识别的开源模型

tf_mobilenetv3_large_075.in1k

开源项目模型

MobileNet-v3大规模图像分类与特征提取模型

t2i-adapter-canny-sdxl-1.0

稳定扩散图像生成

T2I适配器结合Canny检测提升稳定扩散XL的条件控制

LDCC-SOLAR-10.7B

SOLAR论文深度学习

基于SOLAR方法的深度学习模型，应用于数据通信与工程

albert-xxlarge-v1

机器学习Github

大型英文数据集上的预训练语言模型

wav2vec2_tiny_random

深度学习Huggingface

轻量级语音识别模型测试入门

SaProt_650M_PDB

SaProtesm

提供两种加载方式以支持深度学习蛋白质模型的灵活使用

Chip_n_DallE

深度学习合成模型

细致化的文本到图像生成模型

sam2-hiera-tiny

视觉分割SAM 2

提供图像和视频分割功能的开放源码基础模型

PixArt-XL-2-512x512

Pixart-αGithub

快速生成高分辨率图像的高效能模型

yolov8s-table-extraction

目标检测Github

基于YoloV8的表格检测与提取模型

MiniCPM-V-2

场景文本理解MiniCPM-V

多模态语言模型，支持跨平台高效部署

Infinity-Instruct-3M-0625-Yi-1.5-9B

无强化学习模型训练

大规模指令调优模型无需人类反馈的创新

control_v11p_sd15_normalbae

ControlNetGithub

了解ControlNet v1.1的条件扩展功能如何提高文本到图像生成质量

taef1

TAEF1开源项目

高效微型自动编码器增强FLUX.1实时预览

dart-v1-sft

transformers标签生成

优化Danbooru标注生成的Transformer模型

convnextv2_nano.fcmae_ft_in1k

Github开源项目

基于FCMAE的ConvNeXt-V2高效图像分类与特征提取模型

1 2 3

探索AI的无限可能

访问

AI工具导航精选AI信息

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com