
双解码器驱动的照片级图像上色预训练模型

无需图像编码器的轻量级多模态开源模型

基于SwinV2的实景图像4倍超分辨率模型

提高视觉模型长距离空间依赖的处理能力

Mask2Former模型整合多尺度变形和掩码注意力实现高效图像分割

基于分层特征图的轻量级视觉Transformer模型

BEiT架构驱动的高性能单目深度估计模型

ViT架构的多分辨率3D几何视觉模型用于深度估计

跨协方差图像Transformer的高效视觉分类与特征提取模型

开源深度学习模型实现文本到图像的精确转换与生成

基于跨协方差转换器的轻量级图像分类模型

DenseNet图像分类模型实现高效特征提取与精准分类

大规模无标签数据训练的开源深度估计工具

更快更精细的单目深度估计模型

先进的计算机视觉深度估计开源框架

改进型CLIP架构的图像文本预训练模型

边缘检测控制模型实现精准AI图像生成

大型视觉Transformer模型在ImageNet数据集上的图像分类实现

视觉语言对齐模型实现高效零样本图像分类

基于DPT框架的深度估计神经网络
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号