精选AI数据集工具和项目大集合

MeViS: 一个基于运动表达的大规模视频分割基准数据集

MeViS: 一个基于运动表达的大规模视频分割基准数据集

MeViS是一个新的大规模视频分割数据集,专注于使用运动表达来引导视频对象分割。该数据集包含2,006个视频和28,570个运动表达句子,为开发利用运动信息的视频分割算法提供了新的平台。

MeViS视频分割运动表达数据集基准测试Github开源项目
PickScore: 一个开放的文本到图像生成用户偏好数据集及评分模型

PickScore: 一个开放的文本到图像生成用户偏好数据集及评分模型

PickScore是一个创新的开放数据集和评分模型,旨在预测用户对文本到图像生成结果的偏好。本文深入探讨了PickScore的开发过程、主要特点及其在文本到图像生成领域的重要应用。

PickScore数据集文本生成图像用户偏好开源项目Github
Anti-UAV:前沿反无人机技术的突破与挑战

Anti-UAV:前沿反无人机技术的突破与挑战

本文深入探讨了Anti-UAV(反无人机)技术的发展现状、关键技术和未来趋势,介绍了该领域的重要数据集、评估指标和基准方法,并分析了Anti-UAV在安防、反恐等领域的广泛应用前景。

Anti-UAV无人机跟踪计算机视觉目标检测数据集Github开源项目
TACO: 突破算法代码生成的新里程碑

TACO: 突破算法代码生成的新里程碑

TACO(Topics in Algorithmic COde generation dataset)是一个专注于算法代码生成的高质量大规模数据集,旨在为代码生成模型领域提供更具挑战性的训练数据集和评估基准。本文深入解析TACO数据集的特点、使用方法以及在代码生成领域的重要意义。

TACO代码生成算法数据集模型评估Github开源项目
GigaSpeech: 一个革命性的大规模多领域语音识别数据集

GigaSpeech: 一个革命性的大规模多领域语音识别数据集

GigaSpeech是一个不断演进的大规模多领域英语语音识别语料库,包含10,000小时高质量标注音频用于监督学习,以及40,000小时音频用于半监督和无监督学习。本文详细介绍了GigaSpeech数据集的特点、构建过程、使用方法以及在语音识别领域的重要意义。

GigaSpeech语音识别数据集深度学习音频处理Github开源项目
LibriHeavy: 50,000小时的开源自动语音识别语料库

LibriHeavy: 50,000小时的开源自动语音识别语料库

LibriHeavy是一个包含标点、大小写和上下文信息的大规模开源自动语音识别语料库,共50,000小时英语语音数据,为语音识别研究和应用提供了丰富的训练资源。

Libriheavy语音识别数据集标点符号上下文Github开源项目
视觉语言模型(VLM)在视觉任务中的应用:综述与展望

视觉语言模型(VLM)在视觉任务中的应用:综述与展望

本文全面综述了视觉语言模型(VLM)在视觉任务中的应用现状,包括VLM的预训练方法、迁移学习方法和知识蒸馏方法,并对未来研究方向进行了展望。

Vision-Language Models视觉识别任务预训练方法知识蒸馏数据集Github开源项目
UltraChat: 大规模、高质量的对话数据集及其在对话模型训练中的应用

UltraChat: 大规模、高质量的对话数据集及其在对话模型训练中的应用

UltraChat是一个包含150万条高质量多轮对话的大规模数据集,涵盖广泛的主题和指令。基于UltraChat训练的UltraLM模型在多项评测中表现优异,展现了该数据集在提升开源对话模型能力方面的潜力。

UltraLMUltraFeedbackUltraChat模型数据集Github开源项目
深入解析超像素分割算法基准测试:28种最新方法的全面评估

深入解析超像素分割算法基准测试:28种最新方法的全面评估

本文对28种最先进的超像素分割算法在5个数据集上进行了全面的评估和比较,涵盖了算法的视觉质量、性能、运行时间、实现细节和鲁棒性等多个方面,为研究人员和开发者提供了有价值的参考。

Superpixels计算机视觉图像处理算法比较数据集Github开源项目
LVIS-API: 大规模词汇实例分割数据集的强大Python接口

LVIS-API: 大规模词汇实例分割数据集的强大Python接口

LVIS-API是一个用于读取、交互和评估LVIS数据集的Python库。它提供了丰富的功能,包括读取注释文件、可视化标注和评估结果,为计算机视觉研究者和开发者提供了便利的工具。

LVIS大词汇实例分割数据集图像标注APIGithub开源项目
rPPG-Toolbox:深度远程PPG工具箱

rPPG-Toolbox:深度远程PPG工具箱

rPPG-Toolbox是一个开源平台,用于基于相机的生理感知,也称为远程光电容积脉搏波描记法(rPPG)。该工具箱不仅对现有的最先进的神经和无监督方法进行基准测试,还支持灵活快速地开发自己的算法。

rPPG-Toolbox摄像头生理信号检测开源平台算法数据集Github开源项目
MultiBench:多模态表示学习的多尺度基准测试套件

MultiBench:多模态表示学习的多尺度基准测试套件

MultiBench是一个系统化的大规模多模态学习基准测试套件,涵盖15个数据集、10种模态、20个预测任务和6个研究领域。它提供了一个自动化的端到端机器学习管道,简化和标准化了数据加载、实验设置和模型评估过程。

MultiBenchMultimodal学习Benchmark深度学习数据集Github开源项目
探索暗光环境下的计算机视觉: Exclusively Dark Image Dataset简介

探索暗光环境下的计算机视觉: Exclusively Dark Image Dataset简介

Exclusively Dark (ExDARK)数据集是目前最大的低光照图像集,包含7,363张从极低光环境到暮光条件下拍摄的图像,涵盖12个物体类别。该数据集为低光环境下的目标检测和图像增强研究提供了宝贵的资源。

Exclusively Dark低光图像数据集图像增强目标检测Github开源项目
FedScale: 开源联邦学习平台的全面解析

FedScale: 开源联邦学习平台的全面解析

FedScale是一个可扩展的开源联邦学习平台,提供了高级API来实现联邦学习算法,并在不同的硬件和软件后端进行大规模部署和评估。本文全面介绍了FedScale的架构、功能和使用方法。

FedScale联邦学习数据集部署模型评估Github开源项目
MyVision: 革新计算机视觉训练数据生成的在线工具

MyVision: 革新计算机视觉训练数据生成的在线工具

MyVision是一款免费的在线图像标注工具,专为生成计算机视觉机器学习训练数据而设计。它以用户为中心,提供了加速标注过程和管理大型数据集工作流程的功能特性。

MyVision图像注释工具机器学习数据集COCO-SSDGithub开源项目
TFRecord介绍:高效存储和读取数据的TensorFlow格式

TFRecord介绍:高效存储和读取数据的TensorFlow格式

TFRecord是TensorFlow的一种高效数据存储格式,本文全面介绍TFRecord的概念、优势及使用方法,帮助读者掌握这一重要的数据处理工具。

TFRecordReaderTFRecordWriterPyTorchtfrecord数据集Github开源项目
Uncertainty Baselines: Google推出深度学习不确定性和鲁棒性基准

Uncertainty Baselines: Google推出深度学习不确定性和鲁棒性基准

Google推出Uncertainty Baselines项目,为深度学习中的不确定性和鲁棒性研究提供高质量基准实现,旨在推动这一领域的研究进展。

Uncertainty BaselinesTensorFlowTPU模型数据集Github开源项目
fastMRI:加速磁共振成像的开放数据集与基准

fastMRI:加速磁共振成像的开放数据集与基准

fastMRI项目是Facebook AI研究院(FAIR)和纽约大学朗格尼健康中心的一项合作研究项目,旨在利用人工智能技术加速MRI扫描速度,缩短患者检查时间,同时保证图像质量。该项目发布了大规模的MRI原始数据集和临床图像,为研究人员提供了开发和评估AI重建算法的资源。

fastMRI磁共振成像人工智能PyTorch数据集Github开源项目
PFLlib: 一个强大的个性化联邦学习算法库

PFLlib: 一个强大的个性化联邦学习算法库

PFLlib是一个开源的个性化联邦学习算法库,包含37种联邦学习算法、3种实验场景和20个数据集,为联邦学习研究提供了便捷的工具。

PFLlib联邦学习个性化算法库数据集Github开源项目
RewardBench: 评估语言模型奖励模型的创新基准

RewardBench: 评估语言模型奖励模型的创新基准

RewardBench是一个专为评估奖励模型性能而设计的基准测试工具,它能全面衡量包括直接偏好优化(DPO)在内的各类奖励模型的能力和安全性,为奖励模型的研究与应用提供了重要参考。

RewardBench评价标准数据集文献anymodelGithub开源项目