精选AI数据集工具和项目大集合

ua-gec

ua-gec

UA-GEC语法纠错

乌克兰语语法纠错与流畅性语料库

tweetnlp

tweetnlp

TweetNLP自然语言处理

社交媒体文本分析的全能NLP工具集

Automated-Fact-Checking-Resources

Automated-Fact-Checking-Resources

自动事实核查数据集

自动事实核查资源库 数据集、模型与研究进展

awesome-persian-nlp-ir

awesome-persian-nlp-ir

波斯语NLP数据集

波斯语NLP和IR资源汇总

multiwoz

multiwoz

MultiWOZ任务型对话

大规模多领域任务型对话数据集

MagicBrush

MagicBrush

MagicBrush图像编辑

基于人工标注的指令引导图像编辑数据集

ArtGAN

ArtGAN

ArtGAN深度学习

深度学习驱动的艺术品生成与分类开源项目

TDC

TDC

TDC机器学习

人工智能助力药物研发的开源平台

GuitarSet

GuitarSet

GuitarSet吉他转录

专为吉他转录研究设计的音频和标注数据集

CapsFusion

CapsFusion

CapsFusion图像文本数据

创新的大规模图像描述生成框架

HumanArt

HumanArt

Human-Art人体姿态估计

多场景人体数据集助力计算机视觉研究

MVHumanNet

MVHumanNet

MVHumanNet数据集

多视角日常穿着人体捕捉大规模数据集

ViViD

ViViD

ViViD视频虚拟试穿

视频虚拟试衣技术运用扩散模型实现逼真效果

Mol-Instructions

Mol-Instructions

Mol-Instructions生物分子

大规模生物分子指令数据集助力大语言模型

CommonGen

CommonGen

CommonGen文本生成

约束文本生成挑战促进常识推理

hatespeechdata

hatespeechdata

仇恨言论数据集

多语言仇恨言论数据集汇总与研究资源

txtinstruct

txtinstruct

txtinstruct指令调优

开源框架简化指令调优模型开发

NLP-progress

NLP-progress

自然语言处理NLP任务

追踪自然语言处理领域进展的开源项目

NewsMTSC

NewsMTSC

NewsMTSC目标依赖情感分类

新闻文章多目标情感分析的开源数据集和模型

CMB

CMB

CMB医学基准测试

中文医学基准测试,全面评估医疗AI模型的知识与临床能力