Wav2Vec2模型在Librispeech数据集上的音频性别识别应用
专为大规模语言模型设计的推理优化框架
基于SD XL 1.0的高质量着色书图像生成LORA模型
Meta开发的多模态大语言模型实现图像理解与视觉推理
优化的Whisper小型模型实现快速多语言语音转文本
多语言共享向量空间映射的强大工具
基于MS Marco训练的跨编码器模型实现高效文本排序
CLIP-ViT-bigG-14模型实现高效零样本图像分类与检索
AI应用的安全防护模型
高效轻量的移动端视觉转换器
基于Wav2vec2优化的土耳其语语音识别模型
高效单步文本到图像生成模型
先进视觉语言模型实现多分辨率图像和长视频理解
CTranslate2格式Whisper小型模型实现多语言语音识别
基于Transformer的大规模印刷文本OCR模型
开源时间序列预测模型 高效预测基础
XLM-RoBERTa句子嵌入模型支持多语言语义相似度和文本聚类
12类食品图像分类模型 准确率达96%
BGE-Small-EN-v1.5模型为Infinity项目提供高效嵌入式推理
结合图像理解与自然语言处理的多模态AI系统
最新AI工具、AI资讯
独家AI资源、AI项目落地