精选AI数据集工具和项目大集合

arco-era5

arco-era5

ERA5气候数据

云优化和分析就绪的气象再分析数据

Mind2Web

Mind2Web

Mind2Web网页代理

AI通用网页交互代理

awesome-test-time-adaptation

awesome-test-time-adaptation

Test-Time Adaptation分布偏移

测试时适应技术资源汇总与研究概览

hh-rlhf

hh-rlhf

人工智能数据集

AI助手有用性和安全性的人类偏好数据以及人工生成的红队测试数据

Awesome-Talking-Head-Synthesis

Awesome-Talking-Head-Synthesis

Talking Head Synthesis3D

最新音频驱动和神经辐射场技术在数字人头像生成中的应用

datacomp

datacomp

DataCompCLIP模型

多模态预训练数据集构建的创新竞赛

babilong

babilong

BABILong长文本处理

BABILong基准测试长文本处理能力 评估大语言模型极限

OCR_DataSet

OCR_DataSet

文字识别数据集

综合OCR数据集资源库及工具集

kitti360LabelTool

kitti360LabelTool

KITTI-360标注工具

KITTI-360数据集标注工具

RGBD-semantic-segmentation

RGBD-semantic-segmentation

RGBD语义分割深度学习

RGB-D语义分割技术发展综述及性能评估

Calliar

Calliar

Calliar阿拉伯书法

阿拉伯书法在线手写数据集助力数字化研究

trustworthyAI

trustworthyAI

可信AI因果结构学习

因果结构学习工具链与研究资源

AcmeTrace

AcmeTrace

Acme TraceAI实验室

大规模语言模型工作负载数据集

SAM-Med2D

SAM-Med2D

SAM-Med2D医学图像分割

医学图像分割新突破 SAM-Med2D模型

Awesome-Knowledge-Graph-Reasoning

Awesome-Knowledge-Graph-Reasoning

知识图谱推理数据集

全面的知识图谱推理研究资源集合

imageinwords

imageinwords

ImageInWords图像描述

致力于生成超详细图像描述的研究项目

automated-interpretability

automated-interpretability

自动解释性神经元行为

语言模型神经元行为的自动化解释工具

MS-MARCO-Web-Search

MS-MARCO-Web-Search

MS MARCO Web Search数据集

大规模网络数据集推动搜索与机器学习研究进展

panoptic-toolbox

panoptic-toolbox

PanopticStudio3D关键点

PanopticStudio多视角动作捕捉数据处理工具箱

assets

assets

Ultralytics计算机视觉

视觉资产和AI模型资源库