最佳Github AI工具与开源项目集锦

VisionScript: 一种高级计算机视觉编程语言

VisionScript: 一种高级计算机视觉编程语言

VisionScript是一种为执行常见计算机视觉任务而设计的抽象编程语言。它提供了简单的语法来运行对象检测、分类和分割模型,使得计算机视觉任务变得更加简单和高效。

VisionScript计算机视觉Python对象检测图像分类Github开源项目
HAAR.js: 基于JavaScript的Haar级联特征检测库

HAAR.js: 基于JavaScript的Haar级联特征检测库

HAAR.js是一个轻量级的JavaScript特征检测库,基于Viola-Jones-Lienhart等人的Haar级联算法,可用于实现人脸、眼睛等对象的检测。本文详细介绍了HAAR.js的功能特性、使用方法及应用场景。

HAAR.js特征检测JavaScriptViola-Jones算法OpenCVGithub开源项目
AAAI 2024论文集:人工智能前沿研究的全面概览

AAAI 2024论文集:人工智能前沿研究的全面概览

本文全面介绍了AAAI 2024会议的论文集,涵盖了人工智能领域的最新研究成果和进展,为读者提供了AI前沿研究的全面概览。

AAAI-2024人工智能研究论文会议GitHubGithub开源项目
UCF-SST-CitySim1-Dataset: 一个基于无人机的车辆轨迹数据集

UCF-SST-CitySim1-Dataset: 一个基于无人机的车辆轨迹数据集

UCF-SST-CitySim1-Dataset是一个专为安全导向研究和数字孪生应用而设计的大规模车辆轨迹数据集,包含从12个不同地点拍摄的1140分钟无人机视频中提取的高精度车辆轨迹数据。

CitySim车辆轨迹数据集无人机视频交通安全研究数字孪生Github开源项目
Text2Cinemagraph: 使用文本生成动态影像的创新技术

Text2Cinemagraph: 使用文本生成动态影像的创新技术

Text2Cinemagraph是一种全自动方法,能够根据文本描述生成动态影像(cinemagraph)。这项技术可以处理包含想象元素和艺术风格的复杂提示,克服了解释这些图像语义和动作的挑战。

Text2CinemagraphStable DiffusionPyTorchOptical Flow PredictionODISEGithub开源项目
S3Gaussian: 自监督街道高斯模型在自动驾驶中的应用

S3Gaussian: 自监督街道高斯模型在自动驾驶中的应用

本文深入探讨了S3Gaussian项目,这是一种创新的自监督学习方法,利用3D高斯模型来模拟自动驾驶场景中的动态环境,无需额外监督信息即可实现高质量的场景分解和渲染。

S3Gaussian无人驾驶自监督学习3D高斯场景分解Github开源项目
PARE: 3D人体姿态估计的突破性技术

PARE: 3D人体姿态估计的突破性技术

深入探讨PARE(Part Attention Regressor)在3D人体姿态和形状估计领域的创新应用,揭示其在处理遮挡问题上的卓越表现,以及在计算机视觉和人机交互等领域的广泛潜力。

PARE3D人体姿态估计ICCV 2021PyTorch人体形状估计Github开源项目
Awesome NeRF Editing: 探索神经辐射场的编辑技术

Awesome NeRF Editing: 探索神经辐射场的编辑技术

本文深入探讨了神经辐射场(NeRF)编辑技术的最新进展,包括经典论文、相关综述以及近期研究成果,为读者提供了全面的NeRF编辑技术概览。

Neural Radiance Fields3D编辑ECCV 2024CVPR 2024Gaussian SplattingGithub开源项目
Rednose:强大的卡尔曼滤波库,为视觉里程计与传感器融合定位带来革新

Rednose:强大的卡尔曼滤波库,为视觉里程计与传感器融合定位带来革新

探索comma.ai开源的Rednose库,了解其如何通过扩展卡尔曼滤波、误差状态卡尔曼滤波等先进技术,为复杂的非线性系统提供高精度状态估计,特别适用于视觉里程计、传感器融合定位和SLAM等领域。

Kalman filter视觉里程计传感器融合符号化雅可比计算三维定位Github开源项目
卫星图像中的船舶数据集综述

卫星图像中的船舶数据集综述

本文全面介绍了用于船舶检测、分类和分割任务的卫星图像数据集,包括光学和雷达两种类型。文章对各个数据集的特点、规模和用途进行了详细分析,为相关研究提供了宝贵的数据资源参考。

雷达卫星数据集光学卫星数据集船舶检测分类语义分割Github开源项目
CVPR 2023-2024论文集锦:计算机视觉与模式识别领域的前沿进展

CVPR 2023-2024论文集锦:计算机视觉与模式识别领域的前沿进展

全面收录CVPR 2023和2024会议论文,梳理计算机视觉与深度学习领域的最新研究成果,包含论文代码实现链接,为视觉智能研究提供重要参考资料。

CVPR 2024计算机视觉深度学习研究论文GitHubGithub开源项目
参数高效迁移学习: 计算机视觉和多模态领域的前沿进展

参数高效迁移学习: 计算机视觉和多模态领域的前沿进展

探索参数高效迁移学习在计算机视觉和多模态领域的最新研究进展,介绍主流方法和关键技术,分析其在提高模型效率和性能方面的重要作用。

Parameter-Efficient Transfer LearningPromptAdapterComputer VisionMultimodalGithub开源项目
se(3)-TrackNet: 基于合成域图像残差校准的数据驱动6D姿态跟踪

se(3)-TrackNet: 基于合成域图像残差校准的数据驱动6D姿态跟踪

本文介绍了一种名为se(3)-TrackNet的新型神经网络架构,用于长期6D姿态跟踪。该方法通过合成数据训练,实现了在真实图像上的有效工作,并在多个基准测试中展现出优异的性能。

iros20-6d-pose-trackingse(3)-TrackNet6D姿态跟踪机器人操作RGB-D图像Github开源项目
PIX: JAX生态系统中强大的图像处理库

PIX: JAX生态系统中强大的图像处理库

PIX是一个基于JAX构建的高性能图像处理库,为JAX提供了丰富的图像处理功能和工具,支持优化和并行化,是深度学习和计算机视觉研究的得力助手。

PIXJAX图像处理机器学习平行优化Github开源项目
V2V-PoseNet: 基于体素的3D手部和人体姿势估计网络

V2V-PoseNet: 基于体素的3D手部和人体姿势估计网络

V2V-PoseNet是一个创新的深度学习模型,通过将2D深度图转换为3D体素表示,实现了高精度的3D手部和人体姿势估计。该模型在多个公开数据集上取得了state-of-the-art的性能,并在HANDS2017挑战赛中获得冠军。

V2V-PoseNet3D手势估计深度图PyTorch团队SNU CVLABGithub开源项目
使用MTT实现数据集蒸馏:通过匹配训练轨迹生成小规模高质量合成数据集

使用MTT实现数据集蒸馏:通过匹配训练轨迹生成小规模高质量合成数据集

MTT (Matching Training Trajectories)是一种新颖的数据集蒸馏方法,通过优化合成数据以匹配真实数据上的网络训练轨迹,可以生成规模很小但效果很好的合成数据集。本文详细介绍了MTT的原理、实现方法及其在图像分类和纹理合成等任务上的应用。

Dataset DistillationCVPR 2022CIFAR-100ImageNetSynthetic DataGithub开源项目
Diffusion Classifier: 利用预训练扩散模型实现零样本分类

Diffusion Classifier: 利用预训练扩散模型实现零样本分类

Diffusion Classifier是一种新颖的零样本分类方法,它巧妙地利用了预训练扩散模型的条件密度估计能力,无需额外训练即可实现高效的图像分类。这一方法不仅在多个基准测试中取得了强劲的分类性能,还展现出了优于现有方法的多模态组合推理能力。

Diffusion ClassifierStable Diffusionzero-shot分类生成模型ICCV 2023Github开源项目
概率性3D多目标跟踪算法在自动驾驶中的应用与进展

概率性3D多目标跟踪算法在自动驾驶中的应用与进展

本文介绍了一种基于马氏距离的概率性3D多目标跟踪算法,该算法在NeurIPS 2019 AI驾驶奥林匹克研讨会的NuScenes跟踪挑战赛中获得第一名。文章详细阐述了该算法的核心思想、实现细节以及在自动驾驶场景中的应用效果,并对相关工作进行了全面的回顾与展望。

NuScenes Tracking ChallengeAutonomous DrivingAB3DMOTProbabilistic TrackingStanford UniversityGithub开源项目
Clover: 开源无人机开发平台助力自主飞行创新

Clover: 开源无人机开发平台助力自主飞行创新

Clover是一个基于ROS的开源无人机开发框架,为PX4飞控提供用户友好的控制工具。它不仅可作为ROS包使用,更提供预配置的树莓派镜像,让无人机快速上手自主飞行。

CloverROSPX4Raspberry Pi无人机Github开源项目
AVA Dataset 下载器:轻松获取大规模美学视觉分析数据集

AVA Dataset 下载器:轻松获取大规模美学视觉分析数据集

本文介绍了一个名为ava_downloader的开源项目,该项目旨在简化AVA数据集的下载和使用过程。AVA数据集是一个用于美学视觉分析的大规模数据库,包含超过25万张高质量图片。本文将详细介绍该项目的特点、使用方法以及AVA数据集的重要性。

AVA Dataset图像分析美学大规模数据库下载链接Github开源项目