精选AI数据集工具和项目大集合

ALLaVA

ALLaVA

ALLaVAGPT-4V

GPT4V合成数据集助力轻量级视觉语言模型训练

awesome-chatgpt-dataset

awesome-chatgpt-dataset

ChatGPT数据集

综合性AI对话数据集资源助力自定义语言模型训练

awesome-lego-machine-learning

awesome-lego-machine-learning

机器学习LEGO

乐高积木领域机器学习应用资源精选

Grably

Grably

AI工具AI数据

多样化特定数据集助力AI训练

Image In Words

Image In Words

AI工具Image In Words

先进AI技术生成超详细图像文本描述

ChattyDocs

ChattyDocs

AI工具AI助手

AI驱动的文档对话工具 提升信息处理效率

TLM Playground

TLM Playground

AI工具Cleanlab

可信赖语言模型的在线交互式体验平台

Defined.ai

Defined.ai

AI工具AI数据

专业AI训练数据市场平台 提供多领域高质量数据集

open_x_embodiment

open_x_embodiment

Open X-Embodiment机器人学习

统一格式机器人数据集和RT-X模型

GPTeacher

GPTeacher

GPTeacher数据集

GPT-4生成的多模块AI训练数据集

bagel

bagel

Bagel数据集

综合数据源与多样化技术的大语言模型训练框架

ARC-AGI

ARC-AGI

ARC-AGI人工智能

抽象推理基准测试 评估通用人工智能

HD-VG-130M

HD-VG-130M

HD-VG-130M数据集

大规模文本-视频对数据集助力AI视频生成研究

Panda-70M

Panda-70M

Panda-70M视频描述

开创性大规模视频描述数据集融合多重跨模态技术

TabularBenchmarks

TabularBenchmarks

表格数据机器学习

机器学习算法在表格数据上的性能评估基准

llm-datasets

llm-datasets

LLM数据集

LLM微调优质数据集与工具资源库

chat-dataset-baseline

chat-dataset-baseline

中文对话模型AI训练

中文对话模型训练资源整合平台

sfm-disambiguation-colmap

sfm-disambiguation-colmap

SfMCOLMAP

改进结构运动恢复算法 应对场景对称性和重复结构

awesome-ml-for-cybersecurity

awesome-ml-for-cybersecurity

机器学习网络安全

网络安全机器学习资源综合指南

LogicKor

LogicKor

LogicKor韩语语言模型

韩语语言模型多领域推理能力评估工具