
单目深度估计新标杆 精细、稳健且高效

实现开放集目标检测的创新模型

TimeSformer:空间-时间注意力机制的视频分类模型

基于稳定扩散技术的高质量文本到图像生成模型

基于CLIP的开放词汇目标检测模型

多任务视觉AI的统一解决方案

Grounding DINO模型实现开放集目标检测的创新突破

基于扩散技术的高效单图表面法线估计模型

Table Transformer开源表格结构识别模型

ViT-GPT2结合的智能图像描述生成模型

微软GIT-base模型 图像到文本的多功能视觉语言处理工具

大规模视觉语言预训练模型CLIP-ViT-Large

OpenAI开发的CLIP模型实现零样本图像分类和跨模态理解

OpenAI CLIP模型实现零样本图像分类的视觉语言预训练

OpenAI CLIP模型实现零样本图像分类和跨模态匹配

3D生成AI前沿资源与研究综述

2024年CVPR顶级计算机视觉论文集

3D目标检测研究资源汇总 激光雷达方法全览

将3D多目标跟踪与场景重建融合的创新算法

2023年人工智能领域重大突破性研究概览
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号