
Mask2Former大型语义分割模型 适用多种图像分割任务

多功能SDXL图像生成模型 支持艺术和摄影创作

小型Vision Transformer模型用于无监督视觉特征学习

GOT-OCR2_0为OCR技术开创统一端到端模型新纪元

突破性的高质量图像生成模型

Meta推出Llama 3.2多语言大型语言模型系列

ViT-Tiny 轻量级视觉转换器模型实现图像分类与特征提取

统一文本和图像掩码的文档AI预训练模型

Mistral-Nemo-Instruct-2407模型的AWQ量化指令版本

STDiT-v3模型实现开源视频生成和编辑功能

BERT模型在土耳其语句子相似度任务中的应用

Google开源的27B参数大语言模型 支持多种文本生成应用

先进的英语语音识别模型 准确率达98.37%

OWL-ViT:基于CLIP的开放词汇目标检测模型

Meta AI开发的开源预训练Transformer语言模型

多语言语音识别模型 支持高效转录和翻译

BLIP视觉语言预训练模型实现理解与生成双重任务

赫尔辛基大学开发的英德神经机器翻译模型

160M参数的轻量级LLaMA模型用于快速文本生成

基于DeBERTa-v3的自然语言推理模型
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号