目标检测工具集合 - 提升项目效率的最佳选择

ViTAE-Transformer: 推动遥感领域的深度学习研究

ViTAE-Transformer: 推动遥感领域的深度学习研究

本文介绍了ViTAE-Transformer团队在遥感领域的一系列创新研究成果,包括SAMRS、RVSA和RSP等多个重要项目,展示了他们如何利用深度学习技术推动遥感图像分析的进步。

遥感计算机视觉深度学习图像分割目标检测Github开源项目
YOLO-Patch-Based-Inference: 提高小目标检测和实例分割的高效方法

YOLO-Patch-Based-Inference: 提高小目标检测和实例分割的高效方法

YOLO-Patch-Based-Inference是一个Python库,通过分块推理的方式来增强YOLOv8和YOLOv9等模型对小目标的检测和分割能力。该库提供了简单易用的API,支持多种YOLO模型,并能自动优化参数以达到最佳性能。

YOLO深度学习实例分割目标检测计算机视觉Github开源项目
深入探讨学习障碍(LD):定义、识别与支持策略

深入探讨学习障碍(LD):定义、识别与支持策略

本文全面介绍了学习障碍(LD)的定义、特征、评估方法和支持策略,旨在帮助家长、教育工作者和相关人士更好地理解和支持LD儿童,促进他们的学习和发展。

目标检测知识蒸馏定位蒸馏COCOPASCAL VOCGithub开源项目
HybridNets:端到端多任务感知网络的革新之作

HybridNets:端到端多任务感知网络的革新之作

HybridNets是一个创新的端到端多任务感知网络,为自动驾驶等领域带来了全新的解决方案。本文深入解析HybridNets的核心技术、优势特点及其在交通目标检测、可驾驶区域分割和车道线检测等任务上的卓越表现。

HybridNets多任务感知目标检测可行驶区域分割车道线检测Github开源项目
Awesome_Underwater_Datasets: 水下数据集大全

Awesome_Underwater_Datasets: 水下数据集大全

本文总结了各类水下场景相关的开源数据集,包括图像增强、超分辨率、深度估计、图像分割、显著性检测、目标检测等多个方向,为水下图像处理与计算机视觉研究提供了丰富的资源参考。

水下数据集图像增强目标检测分割声学数据Github开源项目
3D点云技术的发展与应用

3D点云技术的发展与应用

3D点云作为一种重要的三维数据表示形式,在计算机视觉、自动驾驶等领域有着广泛应用。本文综述了3D点云技术的最新进展,包括检测、分割、配准等多个方向的研究成果,以及相关数据集和开源项目。

点云3D视觉自动驾驶目标检测语义分割Github开源项目
PointTinyBenchmark: 基于点的微小目标检测与定位工具箱

PointTinyBenchmark: 基于点的微小目标检测与定位工具箱

PointTinyBenchmark是由中国科学院大学视觉组开发的开源工具箱,专注于微小目标检测和定位任务。它基于mmdetection框架,实现了多种先进的检测和定位算法,为微小目标检测研究提供了强大的基准和工具支持。

目标检测目标定位点监督TinyPersonmmdetectionGithub开源项目
深度探索雷达感知技术在自动驾驶领域的应用与发展

深度探索雷达感知技术在自动驾驶领域的应用与发展

本文深入探讨了雷达感知技术在自动驾驶领域的最新进展,包括数据集、算法、挑战等多个方面,为读者全面了解该领域提供了宝贵参考。

雷达数据集自动驾驶信号处理目标检测传感器融合Github开源项目
MogaNet:一种新型高效卷积神经网络架构

MogaNet:一种新型高效卷积神经网络架构

MogaNet是一种创新的卷积神经网络架构,通过多阶门控聚合设计,实现了出色的性能和效率平衡,在图像分类、目标检测等多项计算机视觉任务上取得了卓越成果。

MogaNet图像分类目标检测语义分割人体姿态估计视频预测Github开源项目
深度学习新范式:可逆列网络(RevCol)的设计与应用

深度学习新范式:可逆列网络(RevCol)的设计与应用

RevCol是由MEGVII Technology提出的一种新型神经网络设计范式,通过多级可逆连接实现特征渐进解耦,在计算机视觉多项任务上取得了优异性能。本文详细介绍RevCol的设计思路、网络结构、性能表现及应用前景。

RevCol计算机视觉图像分类目标检测语义分割Github开源项目
BEVFormer: 革命性的基于相机的目标检测基准方法

BEVFormer: 革命性的基于相机的目标检测基准方法

BEVFormer是一种用于自动驾驶感知的创新相机方法,通过时空变换器学习鸟瞰图表示,在nuScenes数据集上实现了56.9%的NDS最新记录。

BEVFormer多相机感知自动驾驶目标检测鸟瞰图表示Github开源项目
YOLOv8-Face: 面部检测的新突破

YOLOv8-Face: 面部检测的新突破

YOLOv8-Face是一个强大的面部检测模型,基于YOLO系列最新的YOLOv8架构,实现了高效准确的人脸检测和关键点定位,为计算机视觉应用提供了新的解决方案。

YOLOv8人脸检测目标检测深度学习计算机视觉Github开源项目
PaddleDetection: 基于飞桨的端到端目标检测开发套件

PaddleDetection: 基于飞桨的端到端目标检测开发套件

PaddleDetection是一个基于PaddlePaddle的目标检测端到端开发套件,提供丰富的模型组件、产业特色模型和应用工具,助力开发者快速实现产业落地。

目标检测PaddleDetection深度学习计算机视觉PaddlePaddleGithub开源项目
GLIP: 突破性的图像-语言预训练模型

GLIP: 突破性的图像-语言预训练模型

GLIP是微软研究院开发的图像-语言预训练模型,在多项视觉任务上展现出强大的零样本和少样本迁移能力,为计算机视觉和自然语言处理的结合开辟了新的方向。

GLIP计算机视觉目标检测预训练零样本学习Github开源项目
Battle of the Backbones:计算机视觉任务预训练模型的大规模比较

Battle of the Backbones:计算机视觉任务预训练模型的大规模比较

深入探讨Battle of the Backbones项目,这是一项对多种计算机视觉任务中各种预训练模型进行大规模比较的研究。本文介绍了项目背景、主要研究内容和重要发现,为读者提供了解这一前沿研究的全面视角。

计算机视觉预训练模型图像分类目标检测图像检索Github开源项目
ED-Pose: 统一端到端多人姿态估计的显式检测框方法

ED-Pose: 统一端到端多人姿态估计的显式检测框方法

ED-Pose是一种创新的端到端多人姿态估计框架,通过引入显式人体检测和关键点检测两个框检测过程,实现了人体级和关键点级特征的统一学习,在COCO和CrowdPose等数据集上取得了最先进的性能。

ED-Pose多人姿态估计目标检测计算机视觉深度学习Github开源项目
Grounding DINO 1.5: 推动开放集目标检测的前沿

Grounding DINO 1.5: 推动开放集目标检测的前沿

IDEA Research推出的Grounding DINO 1.5系列模型,包括高性能的Pro版本和轻量级的Edge版本,在开放集目标检测任务中取得了突破性进展,为计算机视觉领域带来了新的可能。

Grounding DINO 1.5目标检测IDEA Research零样本迁移少样本学习Github开源项目
DN-DETR: 引入查询去噪加速DETR训练

DN-DETR: 引入查询去噪加速DETR训练

DN-DETR是一种新颖的去噪训练方法,可以显著加速DETR(DEtection TRansformer)的训练过程,并深入探讨了DETR类方法收敛缓慢的问题。该方法通过引入查询去噪,有效降低了二分图匹配的难度,从而实现了更快的收敛速度和更好的性能。

DETR目标检测计算机视觉深度学习注意力机制Github开源项目
YOLOv7: 实时目标检测的新突破

YOLOv7: 实时目标检测的新突破

YOLOv7是目标检测领域的最新突破,在速度和精度上都超越了之前的模型。本文全面介绍YOLOv7的特点、创新和应用。

YOLOv7目标检测深度学习计算机视觉性能优化Github开源项目
FasterViT:具有层次注意力机制的快速视觉Transformer

FasterViT:具有层次注意力机制的快速视觉Transformer

FasterViT是一种新型混合CNN-ViT神经网络,专注于计算机视觉应用的高图像吞吐量。它结合了CNN的快速局部表示学习和ViT的全局建模优势,通过创新的层次注意力机制实现了精度和速度的平衡,在多个视觉任务上取得了最先进的性能。

FasterViT视觉Transformer图像分类目标检测层级注意力机制Github开源项目