医学（影像）数据集列表

我主要将此列表作为个人的有趣医学数据集记录，重点关注医学影像。与其尝试对数据集进行分组/聚类，我将尝试为每个数据集维护一组关键词。查看提交日志以了解随时间推移的添加内容。

欢迎随时贡献！

免责声明：请记住要解决真正的临床问题 ☺

我们处理的数据集

Neurite-OASIS

来自OASIS数据集的414个T1 MRI，使用FreeSurfer和SAMSEG处理包括原始图像，以及处理后的体积和生成的解剖分割图 关键词：大型、MRI、分割、标签、注释、已处理

SynthStrip

来自622个MRI、CT和PET扫描的完整头部图像和真实脑部掩模包括不同对比度、分辨率和人群（从婴儿到胶质母细胞瘤患者）的MRI扫描概览还包括部分图像的解剖分割图 关键词：大型、多样化、多模态、脑部掩模、分割、脑提取、颅骨剥离

主要医学影像列表

CheXpert

65,240名患者的224,316张胸部X光片，带有报告标签 关键词：超大型、X光、标签

ChestXray-NIHCC

100000张放射线照片 关键词：超大型、X光、标签

MIMIC-CXR

与227,943项影像研究相关的371,920张胸部X光片 2019年3月16日：尚未与MIMIC ICU数据链接。参见新闻文章 v2：自由文本放射学报告需要申请访问权限 关键词：超大型、X光、标签

PadChest

来自67,000名患者的160,000张图像，由放射科医生解读和报告标记有174种不同的放射学发现、19种鉴别诊断和104个解剖位置，组织为分层分类，映射到标准统一医学语言系统（UMLS） 关键词：超大型、X光、标签

IBM Xray Eye Gaze

MICMIC-CXR数据库上1000多个眼动、放射学报告、口述、分割数据集代码可重现实验 关键词：中型、X光、标签

Cancer Image Archive

多个集合大量各种类型的图像，包括CT、MR、病理学、PT，附带诊断 关键词：超大型、CT、MR、标签

National Lung Screening Trial

Cancer Imaging Archive的一部分 50000多名患者的CT数据，部分病理学，有限可用 关键词：超大型、CT、标签

DeepLesion

32000多个CT扫描，带有注释、元数据、来自放射学报告的语义标签 关键词：超大型、CT、标签

EchoNet-Dynamic

10,000多个带标签的超声心动图视频和人类专家追踪 关键词：超大型、超声、标签

ABCD Neurocognitive Prediction Challenge

8500名年轻（9-10岁）受试者的MRI（约4100用于训练） 关键词：大型、MRI

AAPM Sparse-View CT Reconstruction Challenge

4,000对模拟的2D乳腺CT正弦图/图像对 关键词：大型、CT、重建

Cross-Sectional Multidomain Lexical Processing

两个关于阅读和语言发展的大规模神经影像数据集超过3000个MRI、fMRI 文章 | 更多资源 关键词：大型、MRI

MRNet

1,370次膝关节MRI检查，带有诊断（健康/ACL撕裂/半月板撕裂） 关键词：大型、MRI、标签

fastMRI

k空间数据 1500个完全采样的膝关节MRI和10K临床MRI，以及6.5K脑部MRI。作为挑战赛的一部分 关键词：大型、MRI、k空间

OCMR

开放获取的多通道k空间心血管磁共振成像数据集 k空间数据，约250个体积 关键词：中型、MRI、k空间

PREVENT-AD

1704个MRI，556个淀粉样蛋白和tau脑脊液样本，血液标志物，遗传信息和约400名高风险个体的纵向认知数据 关键词：中型、MRI、遗传学、标签

Medical Segmentation Decathlon

10个带有分割的医学图像数据集来自不同来源的2000多张各种器官的CT和MR图像 关键词：中等规模、MRI、分割

MASSIVE

结构成像验证和评估的多重采集标准化 8000个扩散加权体积单个健康受试者的10个3D FLAIR、T1加权和T2加权数据集 关键词：大规模、MRI

AOMIC：阿姆斯特丹开放MRI集合

1000多个fMRI和其他模态受试者，带有注释事件文件；原始和预处理数据 关键词：中等规模、fMRI

MRIdata

MRI k空间数据集列表

癌症影像档案：LDCT

601系列CT投影数据、重建图像和临床数据报告 关键词：中等规模、CT、重建

脑部MRI LGG FLAIR异常分割

脑部MRI图像及手动FLAIR异常分割掩模来自TCIA LGG集合的110个低级别胶质瘤病例 关键词：中等规模、脑部、MRI、分割、LGG、FLAIR

Studyforrest

受试者数量少，但模态多样（T1、T2、SWI、血管造影、DWI，在3T观看《阿甘正传》时的fMRI（音频+视觉+眼动追踪+生理）和7T（仅音频+生理），一些音频任务和其他重要视觉任务） 关键词：小规模、多模态

肺部图像数据联盟

LIDC-IDRI包含诊断和肺癌筛查CT。 1018个病例，部分有放射科医生注释/分割和结节计数也可通过肺结节分析（LUNA）挑战赛获取 关键词：大规模、CT、标签

乳腺癌MRI数据集

922名乳腺癌患者的公开数据，可用于机器学习和临床研究。包含乳腺MRI、临床、人口统计、病理、治疗、结果和基因组数据以及图像注释（位置）和特征。 关键词：大规模、MRI、标签

UK Biobank

所有影像眼底成像 关键词：超大规模

OpenOrganelle

使用Janelia开发的增强型聚焦离子束扫描电子显微镜（FIB-SEM）技术获取的高分辨率组织尺度体积电子显微镜（vEM）数据集。伴随这些EM体积的是细胞内亚结构的自动分割和分析。 关键词：超大规模、电子显微镜、分割

BrixIA：COVID19严重程度评分评估数据库

4703张COVID19患者的胸部X光片，手动注释Brixia评分 关键词：大规模、X光、新冠

COVID-CT

从几篇COVID19相关论文中收集的349张CT图像图像说明 关键词：中等规模、CT、新冠

肺炎X光

约5000张X光片 关键词：中等规模、X光、肺炎

医学影像数据资源中心（MIDRC）

361名COVID阳性患者的998次胸部X光检查。带有外观分类和气腔疾病分级的注释临床变量 关键词：大规模、X光、新冠

BIMCV-COVID19

1350多张X光片，150多张CT，800个诊断 关键词：中等规模、CT、新冠

MosMedData Covid19

1000多张COVID19患者的CT 50张按像素注释 关键词：大规模、CT、新冠、分割

COVID-19肺部CT病变分割挑战赛

约250张SARS-CoV-2 RT-PCR阳性的胸部CT，带有COVID-19病变注释 关键词：中等规模、CT、新冠、注释、分割

MedSeg COVID-19 CT

约100张分割的CT切片 关键词：中等规模、CT、分割、新冠

COVID-胸部X光

约150张X光片，持续更新，部分医院数据 关键词：中等规模、X光、新冠

BSTI COVID19

持续更新，上次检查时约60名患者，CT 论文PDF 关键词：中等规模、CT、新冠

叙事性功能磁共振成像

345名受试者、891次功能扫描，以及27个不同时长的多样化故事，总计约4.6小时的独特刺激（约43,000字）。 Nature论文 关键词：中等规模，功能磁共振成像

RICORD

1000张X光片和240张CT扫描，附带标注（论文） 关键词：大规模，CT，新冠肺炎，分割

FIRE（眼底图像配准数据集）

129张视网膜图像。 关键词：小规模，眼底

DRIVE：用于血管提取的数字视网膜图像

40张带分割的视网膜图像 关键词：小规模，视网膜，分割

FLARE：快速低GPU内存腹部器官分割

来自11+个国家的500多次CT扫描，包含腹部器官分割（肝脏、肾脏、脾脏和胰腺） 关键词：大规模，腹部，CT

ADNI

各种成像（纵向MRI）、遗传学、临床数据数千名患者 关键词：大规模，MRI，遗传学，临床

VISCERAL

约120个图像卷（全身CT和MRI图像）超过1900个已标注的解剖结构 关键词：中等规模，MRI，CT，全身，手动分割

Mindboggle

似乎有101个手动标记的大脑MRI 关键词：中等规模，MRI，大脑，手动分割

跨部门词汇处理横断面研究

3000次脑部扫描（T1w、bold、事件）标准化测试、分数、人口统计学 关键词：大规模，MRI，功能磁共振成像，测试

杜克乳腺癌筛查DBT

来自5,060名患者的数字乳腺断层合成图像精选数据集。 关键词：大规模，断层合成，DBT，乳腺，检测

CBIS-DDSM（DDSM的精选乳腺影像子集）

2600多项扫描胶片乳腺摄影研究 关键词：大规模，X射线

Neuromorphometrics

63次手动标记的脑部扫描。费用（$1500？）讨论 关键词：中等规模，MRI，大脑，手动分割，收费

自动非刚性组织学图像配准

这是ISBI2019的一项挑战

7特斯拉静息态功能磁共振成像

22名参与者，包括认知和生理测量，以及7T静息态功能磁共振成像

SpineWeb

跨多个数据集的200多名受试者（CT、X射线、MRI）

先天性心脏病3D心血管MRI中的全心脏和大血管分割

20例先天性心脏病心脏MR图像

儿童纵向神经影像学

论文约50名儿童（约10岁），单次随访，包括MRI、功能磁共振成像和评估 关键词：中等规模，功能磁共振成像，纵向

儿童算术处理纵向神经影像学

论文 3T功能磁共振成像，132名典型发育儿童，2个时间点，4项任务 关键词：中等规模，功能磁共振成像，纵向

叙事

汇集了大约七年时间内获得的听觉故事聆听功能磁共振成像数据集 关键词：中等规模，功能磁共振成像

ATLAS：卒中后病变的解剖追踪

229次T1加权MRI扫描（n=220），带有病变分割 MNI152标准空间T1加权平均结构模板图像包含病变元数据的.csv文件论文 关键词：中等规模，MRI，分割

MITOS_WSI_CMC

21张犬乳腺癌全扫描图像。由2/3名专家标注 关键词：小规模，2D，全扫描成像

FeTA数据集

48次手动标注的子宫内胎儿MR 关键词：小规模，MRI，胎儿，标签

SIMON

单个志愿者，在多个地点进行了73次扫描，时间跨度约17年 MRI,每次至少进行T1扫描,其他模态因会话而异。提供表型文件 关键词:小规模,MRI,纵向研究

BigBrain

单个体积,组织学空间,100微米分辨率,包含灰质/白质表面和皮层层 ftp://bigbrain.loris.ca | 交互式 关键词:小规模,组织学,高分辨率,分割

100微米人脑MRI

单个体积,超高分辨率MRI数据集(100微米) 关键词:小规模,MRI,大脑

自然场景数据集(CMRR计划)

8名受试者大规模fMRI(40次会话,高采样率,高分辨率)。T1加权,T2加权,T2*加权MRI 视频描述 关键词:小规模,MRI,大脑,fMRI

大脑目录

不同动物的(离体)大脑MRI或大脑 关键词:小规模,MRI,大脑,动物

多壳层扩散

健康旅行成年人的三次扩散 关键词:小规模,MRI,扩散,大脑

产前MRI

产前大脑MRI样本(似乎是单个受试者?) 关键词:小规模,MRI,胎儿

BCNB:早期乳腺癌粗针活检全扫描图像数据集

1058张全扫描图像(WSIs)及相应的临床特征部分肿瘤区域在WSIs中已标注临床特征包括年龄、肿瘤大小、肿瘤类型、ER、PR、HER2、HER2表达、组织学分级、手术、Ki67、分子亚型、淋巴结转移数量和ALN状态论文参考 关键词:大规模,乳腺癌,多模态,WSI,临床特征

BCI:乳腺癌免疫组织化学图像生成数据集

4870对配准的HE-IHC图像对,涵盖HER2的四个表达水平(0、1+、2+、3+) 关键词:大规模,乳腺癌,HE,IHC

非医学但有用/有趣

时刻

其他列表或汇集资源(相关xkcd)

Giorgos Sfikas:GitHub上的医学影像数据集
Andy Beam:GitHub上的医学数据
Christopher Madan:openMorph(开放获取MRI,结构良好的列表)
Stephen Aylward的开放获取医学图像存储库列表
Google数据集搜索
grand-challenges
学术种子
multiBrain
openneuro数据库注意其"快速预览"功能
癌症影像档案
康奈尔公共图像数据库

medical-datasets

医学（影像）数据集列表

我们处理的数据集

主要医学影像列表

非影像

非医学但有用/有趣

其他列表或汇集资源(相关xkcd)

编辑推荐精选

扣子-AI办公

堆友

码上飞

Vora

Refly.AI

酷表ChatExcel

TRAE编程

AIWritePaper论文写作

博思AIPPT

潮际好麦

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号