多模态视觉语言模型实现图像视频理解与交互
多语言支持和长文本处理的开源预训练模型
基于稳定扩散的实时音乐生成模型
英语语音情感识别模型:Wav2Vec 2.0的微调应用
动态分辨率视觉模型提供高效特征提取和OCR功能
基于SDXL的真实感小马图像生成模型
Stable Diffusion XL驱动的动漫风格小马图像生成模型
无限制AI文本到图像生成器 支持3D渲染和多语言
融合多种预训练范式的通用语言模型
ConvNeXt-V2图像分类模型 FCMAE预训练与ImageNet微调
高性能开源大语言模型
突破性能界限的高效开源语言模型
Midjourney风格AI图像生成模型 FLUX.1-dev的艺术呈现
基于深度学习的高性能开放域聊天机器人
基于SigLIP和Gemma的多语言视觉语言模型
小型嵌入模型在MTEB基准测试中展现卓越性能
面向说话人验证的先进语音模型
支持23种印度语言和英语的大规模多语言预训练模型
多任务语言模型展现跨任务零样本泛化能力
Meta推出的405B参数多语言AI模型支持128K上下文