单目深度估计新标杆 精细、稳健且高效
实现开放集目标检测的创新模型
TimeSformer:空间-时间注意力机制的视频分类模型
基于稳定扩散技术的高质量文本到图像生成模型
基于CLIP的开放词汇目标检测模型
多任务视觉AI的统一解决方案
Grounding DINO模型实现开放集目标检测的创新突破
基于扩散技术的高效单图表面法线估计模型
Table Transformer开源表格结构识别模型
ViT-GPT2结合的智能图像描述生成模型
微软GIT-base模型 图像到文本的多功能视觉语言处理工具
大规模视觉语言预训练模型CLIP-ViT-Large
OpenAI开发的CLIP模型实现零样本图像分类和跨模态理解
OpenAI CLIP模型实现零样本图像分类的视觉语言预训练
OpenAI CLIP模型实现零样本图像分类和跨模态匹配
3D生成AI前沿资源与研究综述
2024年CVPR顶级计算机视觉论文集
3D目标检测研究资源汇总 激光雷达方法全览
将3D多目标跟踪与场景重建融合的创新算法
2023年人工智能领域重大突破性研究概览
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号