最佳PyTorch工具集合:AI开发者的实用资源

yolov10x

yolov10x

深度学习Github

高效的实时端到端物体检测工具

cogvlm2-llama3-caption

cogvlm2-llama3-caption

PyTorchHuggingface

视频转文本方案,助力优化文本-视频模型训练

Virchow

Virchow

Github模型

自监督视觉模型实现病理图像顶尖性能

rut5-base-absum

rut5-base-absum

数据集Github

结合多任务训练的俄语文本抽象摘要模型

vit_small_patch16_384.augreg_in21k_ft_in1k

vit_small_patch16_384.augreg_in21k_ft_in1k

ImageNet图像分类

增强的视觉转换器模型及其在图像分类中的应用

yolov8s-table-extraction

yolov8s-table-extraction

目标检测Github

基于YoloV8的表格检测与提取模型

bigvgan_v2_24khz_100band_256x

bigvgan_v2_24khz_100band_256x

GradioPyTorch

大规模训练的通用神经声码器

yolov10m

yolov10m

计算机视觉PyTorch

高效的实时目标检测系统

yolov5m-license-plate

yolov5m-license-plate

PyTorchYOLOv5

车牌检测的YOLOv5模型支持Pytorch适用于多种视觉任务

mobilenetv4_conv_small.e2400_r224_in1k

mobilenetv4_conv_small.e2400_r224_in1k

Github模型

MobileNet-V4图像分类模型简介

BioMistral-7B-GGUF

BioMistral-7B-GGUF

PyTorch开源项目

精准医学文本生成的多位量化模型

HRPolicyQandA

HRPolicyQandA

PyTorch开源项目

使用定制训练的GPT-2模型提升问答系统的响应能力

bigvgan_base_22khz_80band

bigvgan_base_22khz_80band

Github开源项目

支持多采样率的通用神经声码器音频合成系统

ruBert-base

ruBert-base

语言模型ruBert

专为俄语遮蔽填充任务优化的Transformer预训练语言模型

vit_base_patch16_224.orig_in21k_ft_in1k

vit_base_patch16_224.orig_in21k_ft_in1k

Vision Transformertimm

基于ImageNet大规模数据集的Vision Transformer模型

Virchow2

Virchow2

图像识别PyTorch

基于神经网络的病理切片图像分析与特征提取模型

mobilevitv2-1.0-imagenet1k-256

mobilevitv2-1.0-imagenet1k-256

图像分类PyTorch

MobileViTv2中的可分离自注意力实现高效图像分类

vilt-b32-mlm

vilt-b32-mlm

语言建模Github

探索无卷积技术在ViLT模型中的应用

yolov5n-license-plate

yolov5n-license-plate

PyTorchYOLOv5

基于YOLOv5的轻量级车牌检测模型

deepseek-coder-6.7B-base-AWQ

deepseek-coder-6.7B-base-AWQ

模型训练PyTorch

大规模训练的代码语言模型,支持项目级代码补全和填充