双解码器驱动的照片级图像上色预训练模型
无需图像编码器的轻量级多模态开源模型
基于SwinV2的实景图像4倍超分辨率模型
提高视觉模型长距离空间依赖的处理能力
Mask2Former模型整合多尺度变形和掩码注意力实现高效图像分割
基于分层特征图的轻量级视觉Transformer模型
BEiT架构驱动的高性能单目深度估计模型
ViT架构的多分辨率3D几何视觉模型用于深度估计
跨协方差图像Transformer的高效视觉分类与特征提取模型
开源深度学习模型实现文本到图像的精确转换与生成
基于跨协方差转换器的轻量级图像分类模型
DenseNet图像分类模型实现高效特征提取与精准分类
大规模无标签数据训练的开源深度估计工具
更快更精细的单目深度估计模型
先进的计算机视觉深度估计开源框架
改进型CLIP架构的图像文本预训练模型
边缘检测控制模型实现精准AI图像生成
大型视觉Transformer模型在ImageNet数据集上的图像分类实现
视觉语言对齐模型实现高效零样本图像分类
基于DPT框架的深度估计神经网络
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号