精选计算机视觉工具:AI应用、网站与开源项目大全

Depth-Anything-V2-Small-hf

Depth-Anything-V2-Small-hf

模型Github

单目深度估计新标杆 精细、稳健且高效

grounding-dino-base

grounding-dino-base

计算机视觉零样本学习

实现开放集目标检测的创新模型

timesformer-hr-finetuned-k600

timesformer-hr-finetuned-k600

模型视频分类

TimeSformer:空间-时间注意力机制的视频分类模型

stable-diffusion-2-1-base

stable-diffusion-2-1-base

人工智能绘图模型

基于稳定扩散技术的高质量文本到图像生成模型

owlv2-base-patch16-ensemble

owlv2-base-patch16-ensemble

模型目标检测

基于CLIP的开放词汇目标检测模型

Florence-2-large

Florence-2-large

图像处理计算机视觉

多任务视觉AI的统一解决方案

grounding-dino-tiny

grounding-dino-tiny

模型目标检测

Grounding DINO模型实现开放集目标检测的创新突破

marigold-normals-lcm-v0-1

marigold-normals-lcm-v0-1

模型Github

基于扩散技术的高效单图表面法线估计模型

table-transformer-structure-recognition-v1.1-all

table-transformer-structure-recognition-v1.1-all

模型计算机视觉

Table Transformer开源表格结构识别模型

vit-gpt2-image-captioning

vit-gpt2-image-captioning

模型计算机视觉

ViT-GPT2结合的智能图像描述生成模型

git-base

git-base

模型图像到文本

微软GIT-base模型 图像到文本的多功能视觉语言处理工具

clip-vit-large-patch14-336

clip-vit-large-patch14-336

ViT计算机视觉

大规模视觉语言预训练模型CLIP-ViT-Large

clip-vit-base-patch16

clip-vit-base-patch16

人工智能计算机视觉

OpenAI开发的CLIP模型实现零样本图像分类和跨模态理解

clip-vit-base-patch32

clip-vit-base-patch32

零样本学习OpenAI

OpenAI CLIP模型实现零样本图像分类的视觉语言预训练

clip-vit-large-patch14

clip-vit-large-patch14

人工智能计算机视觉

OpenAI CLIP模型实现零样本图像分类和跨模态匹配

Awesome-3D-AIGC

Awesome-3D-AIGC

3D AIGC生成式AI

3D生成AI前沿资源与研究综述

top-cvpr-2024-papers

top-cvpr-2024-papers

CVPR 2024计算机视觉

2024年CVPR顶级计算机视觉论文集

Awesome-3D-Object-Detection

Awesome-3D-Object-Detection

3D目标检测激光雷达

3D目标检测研究资源汇总 激光雷达方法全览

MOTSFusion

MOTSFusion

MOTSFusion目标跟踪

将3D多目标跟踪与场景重建融合的创新算法

best_AI_papers_2023

best_AI_papers_2023

AI深度学习

2023年人工智能领域重大突破性研究概览