深度学习最佳AI工具集合:网站、应用和开源项目

llava-onevision-qwen2-7b-ov-chat

llava-onevision-qwen2-7b-ov-chat

多模态图像处理

LLaVA-OneVision多模态AI模型支持图像和视频交互

convnext-xlarge-384-22k-1k

convnext-xlarge-384-22k-1k

计算机视觉神经网络

融合现代设计的高性能图像分类卷积神经网络

CogVideoX-5b-I2V

CogVideoX-5b-I2V

模型视频生成

开源图像到视频生成模型支持多种精度和量化推理

sat-12l-sm

sat-12l-sm

模型Github

先进的多语言文本句子分割模型

indobert-model-ner

indobert-model-ner

模型模型微调

IndobertNER:基于BERT的印度尼西亚语命名实体识别模型

food

food

ViTHuggingface

基于Vision Transformer的101种美食图像分类模型

bert-base-parsbert-uncased

bert-base-parsbert-uncased

Huggingface波斯语言模型

基于BERT的波斯语自然语言处理模型ParsBERT

mxbai-rerank-base-v1

mxbai-rerank-base-v1

transformersHuggingface

跨语言重排序模型提升搜索结果相关性

stable-diffusion-3.5-large

stable-diffusion-3.5-large

人工智能模型模型

多模态扩散变换器模型实现高质量图像生成

instruct-pix2pix

instruct-pix2pix

AI绘图InstructPix2Pix

基于文本指令的智能图像编辑深度学习模型

bert-large-uncased-whole-word-masking

bert-large-uncased-whole-word-masking

Huggingface模型

BERT大型无大小写全词掩码预训练模型

tango-full

tango-full

模型生成式人工智能

基于扩散模型的高质量文本到音频生成工具

pegasus_paraphrase

pegasus_paraphrase

模型Github

PEGASUS基于文本改写和释义模型

UNI

UNI

图像处理Huggingface

病理学AI基础模型助力精准医疗诊断

Jamba-v0.1

Jamba-v0.1

模型开源项目

混合SSM-Transformer架构的高性能大语言模型

resnet-50-finetuned-cats_vs_dogs

resnet-50-finetuned-cats_vs_dogs

模型模型微调

ResNet-50微调模型实现高精度猫狗图像分类

keyphrase-extraction-kbir-inspec

keyphrase-extraction-kbir-inspec

模型Inspec数据集

基于KBIR的科学文献关键短语提取模型

bart-finetuned-text-summarization

bart-finetuned-text-summarization

模型Github

BART Large CNN模型实现精准文本摘要

facial_emotions_image_detection

facial_emotions_image_detection

ViTHuggingface

ViT模型驱动的人脸表情识别系统

hubert-base-persian-speech-gender-recognition

hubert-base-persian-speech-gender-recognition

模型Wav2Vec2

HuBERT波斯语语音性别识别模型