精选AI数据集工具和项目大集合

LViT: 语言与视觉变压器在医学图像分割中的融合

LViT: 语言与视觉变压器在医学图像分割中的融合

LViT是一种创新的医学图像分割模型,将自然语言处理与计算机视觉技术相结合,通过引入医学文本注释来弥补图像数据质量不足的问题,从而提高分割性能。本文将详细介绍LViT模型的原理、架构、应用以及在多个医学图像数据集上的出色表现。

LViT医学图像分割Vision Transformer数据集深度学习Github开源项目
深度伪造检测研究最新进展:数据集、工具与方法综述

深度伪造检测研究最新进展:数据集、工具与方法综述

本文全面梳理了深度伪造检测领域的最新研究进展,包括常用数据集、检测工具、竞赛以及各种检测方法,为从事该领域研究的学者和工程师提供了系统的参考。

Deepfake检测数据集竞赛工具论文Github开源项目
鸟类声音识别技术综述:从传统方法到深度学习

鸟类声音识别技术综述:从传统方法到深度学习

本文综述了鸟类声音识别领域的研究进展,包括数据集、算法模型、开源项目和竞赛等方面,重点介绍了从传统机器学习方法到深度学习方法的演进过程,以及当前研究的热点和挑战。

鸟类识别数据集机器学习音频处理生态学Github开源项目
MedMNIST: 一个大规模轻量级��的2D和3D生物医学图像分类基准数据集

MedMNIST: 一个大规模轻量级的2D和3D生物医学图像分类基准数据集

MedMNIST是一个包含18个标准化的2D和3D生物医学图像数据集的集合,旨在为医学图像分析、计算机视觉和机器学习领域提供多样化的基准测试资源。本文将深入介绍MedMNIST的特点、结构和应用,探讨其在医学影像研究和教育中的重要价值。

MedMNIST医学图像分类神经网络机器学习数据集Github开源项目
深入探讨TextClassificationBenchmark:文本分类的全面评测框架

深入探讨TextClassificationBenchmark:文本分类的全面评测框架

TextClassificationBenchmark是一个基于PyTorch的文本分类基准测试框架,集成了多种数据集和先进模型,为研究人员和开发者提供了全面的文本分类性能评估平台。

文本分类深度学习模型数据集PyTorch基准测试Github开源项目
SpeechIO Leaderboard: 全面评测语音识别系统的开放平台

SpeechIO Leaderboard: 全面评测语音识别系统的开放平台

SpeechIO Leaderboard是一个用于评测和比较自动语音识别(ASR)系统的开放平台。它提供了丰富的测试集、多种模型和标准化的评测流程,为ASR技术的进步提供了重要基准。

语音识别基准测试数据集模型评估Github开源项目
AwesomeAnimeResearch: 动漫研究领域的前沿探索

AwesomeAnimeResearch: 动漫研究领域的前沿探索

本文深入探讨了AwesomeAnimeResearch项目,全面介绍了动漫研究领域的最新进展,包括数据集构建、图像生成、图像转换、自动线稿上色等多个方向的前沿成果,为动漫AI研究提供了全面的参考。

动漫研究数据集图像生成图像翻译生成对抗网络Github开源项目
表面缺陷检测技术发展现状与展望

表面缺陷检测技术发展现状与展望

本文全面介绍了表面缺陷检测技术的发展现状,包括关键问题、常用数据集、研究进展等,并对未来发展趋势进行了展望。文章内容丰富、结构清晰,对从事相关研究的人员具有重要参考价值。

表面缺陷检测数据集深度学习计算机视觉工业应用Github开源项目
UA-GEC:乌克兰语语法纠错与流畅性语料库

UA-GEC:乌克兰语语法纠错与流畅性语料库

UA-GEC是首个针对乌克兰语的语法纠错和流畅性语料库,为乌克兰语自然语言处理研究提供了宝贵的数据资源。本文详细介绍了UA-GEC语料库的背景、特点、数据统计以及应用前景。

UA-GEC语法纠错乌克兰语语料库数据集Github开源项目
TweetNLP: 面向社交媒体的先进自然语言处理工具

TweetNLP: 面向社交媒体的先进自然语言处理工具

TweetNLP是一个专门为Twitter等社交媒体设计的自然语言处理工具包,提供了多种强大的NLP功能,包括情感分析、主题分类、命名实体识别等。本文详细介绍了TweetNLP的主要功能、使用方法以及其在社交媒体文本分析中的应用价值。

TweetNLP自然语言处理社交媒体模型数据集Github开源项目
自��动化事实核查资源汇总:助力新闻真实性验证

自动化事实核查资源汇总:助力新闻真实性验证

本文全面介绍了自动化事实核查领域的最新研究进展,包括任务定义、数据集、模型方法等,为相关研究者提供了丰富的参考资源。

自动事实核查数据集多模态虚假信息检测社交媒体Github开源项目
Awesome Persian NLP/IR: 波斯语自然语言处理和信息检索资源大全

Awesome Persian NLP/IR: 波斯语自然语言处理和信息检索资源大全

这是一个全面收集和整理波斯语自然语言处理(NLP)和信息检索(IR)相关工具、数据集、模型和研究资源的精选列表,旨在为从事波斯语NLP和IR研究与应用的开发者和研究人员提供便利。

波斯语NLP数据集模型工具资源Github开源项目
MultiWOZ:大规模多领域任务型对话数据集

MultiWOZ:大规模多领域任务型对话数据集

MultiWOZ是一个大规模多领域的任务型对话数据集,包含超过10,000个人-人对话,覆盖多个领域和主题。它已成为对话系统研究的重要基准数据集,推动了任务型对话系统的进展。

MultiWOZ任务型对话数据集对话状态追踪对话生成Github开源项目
MagicBrush: 一个革命性的指令引导图像编辑数据集

MagicBrush: 一个革命性的指令引导图像编辑数据集

探索MagicBrush数据集如何推动AI图像编辑技术的发展,以及它对计算机视觉和人工智能领域的深远影响。

MagicBrush图像编辑数据集指令引导InstructPix2PixGithub开源项目
ArtGAN: 革新艺术创作的生成对抗网络

ArtGAN: 革新艺术创作的生成对抗网络

ArtGAN是一种创新的生成对抗网络模型,旨在合成高质量的艺术作品图像。本文将详细介绍ArtGAN的原理、特点及其在艺术创作领域的应用前景。

ArtGAN深度学习艺术生成图像分类数据集Github开源项目
Therapeutics Data Commons: 人工智能在治疗科学中的基础

Therapeutics Data Commons: 人工智能在治疗科学中的基础

Therapeutics Data Commons (TDC) 是一个整合人工智能和治疗科学的开放资源平台,为药物发现和开发提供机器学习数据集和任务。

TDC机器学习药物发现人工智能数据集Github开源项目
CapsFusion: 重新�思考大规模图像-文本数据

CapsFusion: 重新思考大规模图像-文本数据

CapsFusion是一个创新的框架,利用大型语言模型融合网络图像-文本对和合成标题的优势,解决了现有多模态模型在可扩展性和世界知识方面的不足,为大规模多模态预训练提供了高质量数据。

CapsFusion图像文本数据大型多模态模型大语言模型数据集Github开源项目
HumanArt:跨越自然与人工场景的多功能人体数据集

HumanArt:跨越自然与人工场景的多功能人体数据集

HumanArt是一个多功能的以人为中心的数据集,旨在弥合自然场景和人工场景之间的差距。它包含了20种高质量的人体场景,涵盖了2D和3D表示的自然人和人工人体。这个数据集为人体检测、姿态估计、3D人体重建等多种人体相关任务提供了宝贵的训练和评估资源。

Human-Art人体姿态估计数据集人工智能计算机视觉Github开源项目
MVHumanNet:一个大规模多视角日常穿着人体捕捉数据集

MVHumanNet:一个大规模多视角日常穿着人体捕捉数据集

MVHumanNet是一个包含4,500个人类身份、9,000套日常服装、60,000个动作序列和6.45亿帧图像的大规模多视角人体捕捉数据集,为计算机视觉和人工智能研究提供了丰富的人体数据资源。

MVHumanNet数据集人体捕捉多视角计算机视觉Github开源项目
Mol-Instructions: 一个大规模的生物分子指令数据集助力大型语言模型

Mol-Instructions: 一个大规模的生物分子指令数据集助力大型语言模型

Mol-Instructions 是一个专为生物分子领域设计的综合指令数据集,包含分子导向指令、蛋白质导向指令和生物分子文本指令三个关键组成部分。该数据集旨在提高大型语言模型对生物分子特征和行为的理解和预测能力。

Mol-Instructions生物分子大语言模型数据集蛋白质Github开源项目