精选AI数据集工具和项目大集合

MeViS

MeViS

MeViS视频分割

基于运动表达的大规模视频目标分割数据集

PickScore

PickScore

PickScore数据集

优化文本到图像生成的用户偏好数据集和模型

Awesome-Video-Diffusion-Models

Awesome-Video-Diffusion-Models

视频生成模型开源工具箱

视频扩散模型研究进展与开源资源综述

Anti-UAV

Anti-UAV

Anti-UAV无人机跟踪

无人机目标检测与追踪开源项目

TACO

TACO

TACO代码生成

推动算法代码生成模型发展的新基准数据集

GigaSpeech

GigaSpeech

GigaSpeech语音识别

多领域英语语音识别数据集提供10,000小时转录音频

libriheavy

libriheavy

Libriheavy语音识别

大规模语音识别数据集,50,000小时带标点和上下文

roapi

roapi

ROAPIAPI

无代码自动生成数据集的只读API服务

VLM_survey

VLM_survey

Vision-Language Models视觉识别任务

用于视觉任务的 AWESOME 视觉语言模型集合

UltraChat

UltraChat

UltraLMUltraFeedback

大规模、多样化的多轮对话数据和模型

CVPR2023-DMVFN

CVPR2023-DMVFN

CVPR2023视频预测

动态多尺度体素流网络在视频预测领域的应用

superpixel-benchmark

superpixel-benchmark

Superpixels计算机视觉

超像素算法的全面评估与性能比较

lvis-api

lvis-api

LVIS大词汇实例分割

大规模词汇实例分割API的便捷安装与功能

rPPG-Toolbox

rPPG-Toolbox

rPPG-Toolbox摄像头生理信号检测

相机生理传感的开源远程光学容积成像平台

MultiBench

MultiBench

MultiBenchMultimodal学习

多模态学习的多尺度标准基准

Exclusively-Dark-Image-Dataset

Exclusively-Dark-Image-Dataset

Exclusively Dark低光图像

低光环境中的目标检测与图像增强数据集

FedScale

FedScale

FedScale联邦学习

可扩展的开源联邦学习(FL)引擎和基准测试平台

myvision

myvision

MyVision图像注释工具

免费在线图像标注工具

tfrecord

tfrecord

TFRecordReaderTFRecordWriter

允许在 python 中有效地读取和写入 tfrecord 文件

uncertainty-baselines

uncertainty-baselines

Uncertainty BaselinesTensorFlow

提供高质量的不确定性和鲁棒性标准模板