medical-datasets

medical-datasets

医学影像数据集汇总 从MRI到X射线的全面资源

medical-datasets是一个综合性医学影像数据集资源库,收录了MRI、CT和X射线等多种模态的影像数据。涵盖从大脑到胸部的多个人体部位,不仅包含原始图像,还提供分割标注和临床诊断等信息。该项目为医学影像分析、人工智能和机器学习领域的研究与应用提供了丰富的数据支持。

医学影像数据集MRICTX光分割标注Github开源项目

医学(影像)数据集列表

我主要将此列表作为个人的有趣医学数据集记录,重点关注医学影像。 与其尝试对数据集进行分组/聚类,我将尝试为每个数据集维护一组关键词。 查看提交日志以了解随时间推移的添加内容。

欢迎随时贡献!

免责声明:请记住要解决真正的临床问题 ☺

我们处理的数据集

Neurite-OASIS

来自OASIS数据集的414个T1 MRI,使用FreeSurfer和SAMSEG处理 包括原始图像,以及处理后的体积和生成的解剖分割图 关键词:大型、MRI、分割、标签、注释、已处理

SynthStrip

来自622个MRI、CT和PET扫描的完整头部图像和真实脑部掩模 包括不同对比度、分辨率和人群(从婴儿到胶质母细胞瘤患者)的MRI扫描概览 还包括部分图像的解剖分割图 关键词:大型、多样化、多模态、脑部掩模、分割、脑提取、颅骨剥离

主要医学影像列表

CheXpert

65,240名患者的224,316张胸部X光片,带有报告标签 关键词:超大型、X光、标签

ChestXray-NIHCC

100000张放射线照片 关键词:超大型、X光、标签

MIMIC-CXR

与227,943项影像研究相关的371,920张胸部X光片 2019年3月16日:尚未与MIMIC ICU数据链接。参见新闻文章 v2:自由文本放射学报告 需要申请访问权限 关键词:超大型、X光、标签

PadChest

来自67,000名患者的160,000张图像,由放射科医生解读和报告 标记有174种不同的放射学发现、19种鉴别诊断和104个解剖位置,组织为分层分类,映射到标准统一医学语言系统(UMLS) 关键词:超大型、X光、标签

IBM Xray Eye Gaze

MICMIC-CXR数据库上1000多个眼动、放射学报告、口述、分割数据集 代码可重现实验 关键词:中型、X光、标签

Cancer Image Archive

多个集合 大量各种类型的图像,包括CT、MR、病理学、PT,附带诊断 关键词:超大型、CT、MR、标签

National Lung Screening Trial

Cancer Imaging Archive的一部分 50000多名患者的CT数据,部分病理学,有限可用 关键词:超大型、CT、标签

DeepLesion

32000多个CT扫描,带有注释、元数据、来自放射学报告的语义标签 关键词:超大型、CT、标签

EchoNet-Dynamic

10,000多个带标签的超声心动图视频和人类专家追踪 关键词:超大型、超声、标签

ABCD Neurocognitive Prediction Challenge

8500名年轻(9-10岁)受试者的MRI(约4100用于训练) 关键词:大型、MRI

AAPM Sparse-View CT Reconstruction Challenge

4,000对模拟的2D乳腺CT正弦图/图像对 关键词:大型、CT、重建

Cross-Sectional Multidomain Lexical Processing

两个关于阅读和语言发展的大规模神经影像数据集 超过3000个MRI、fMRI 文章 | 更多资源 关键词:大型、MRI

MRNet

1,370次膝关节MRI检查,带有诊断(健康/ACL撕裂/半月板撕裂) 关键词:大型、MRI、标签

fastMRI

k空间数据 1500个完全采样的膝关节MRI和10K临床MRI,以及6.5K脑部MRI。 作为挑战赛的一部分 关键词:大型、MRI、k空间

OCMR

开放获取的多通道k空间心血管磁共振成像数据集 k空间数据,约250个体积 关键词:中型、MRI、k空间

PREVENT-AD

1704个MRI,556个淀粉样蛋白和tau脑脊液样本,血液标志物,遗传信息和约400名高风险个体的纵向认知数据 关键词:中型、MRI、遗传学、标签

Medical Segmentation Decathlon

10个带有分割的医学图像数据集 来自不同来源的2000多张各种器官的CT和MR图像 关键词:中等规模、MRI、分割

MASSIVE

结构成像验证和评估的多重采集标准化 8000个扩散加权体积 单个健康受试者的10个3D FLAIR、T1加权和T2加权数据集 关键词:大规模、MRI

AOMIC:阿姆斯特丹开放MRI集合

1000多个fMRI和其他模态受试者,带有注释事件文件;原始和预处理数据 关键词:中等规模、fMRI

MRIdata

MRI k空间数据集列表

癌症影像档案:LDCT

601系列CT投影数据、重建图像和临床数据报告 关键词:中等规模、CT、重建

脑部MRI LGG FLAIR异常分割

脑部MRI图像及手动FLAIR异常分割掩模 来自TCIA LGG集合的110个低级别胶质瘤病例 关键词:中等规模、脑部、MRI、分割、LGG、FLAIR

Studyforrest

受试者数量少,但模态多样(T1、T2、SWI、血管造影、DWI,在3T观看《阿甘正传》时的fMRI(音频+视觉+眼动追踪+生理)和7T(仅音频+生理),一些音频任务和其他重要视觉任务) 关键词:小规模、多模态

肺部图像数据联盟

LIDC-IDRI包含诊断和肺癌筛查CT。 1018个病例,部分有放射科医生注释/分割和结节计数 也可通过肺结节分析(LUNA)挑战赛获取 关键词:大规模、CT、标签

乳腺癌MRI数据集

922名乳腺癌患者的公开数据,可用于机器学习和临床研究。 包含乳腺MRI、临床、人口统计、病理、治疗、结果和基因组数据以及图像注释(位置)和特征。 关键词:大规模、MRI、标签

UK Biobank

所有影像 眼底成像 关键词:超大规模

OpenOrganelle

使用Janelia开发的增强型聚焦离子束扫描电子显微镜(FIB-SEM)技术获取的高分辨率组织尺度体积电子显微镜(vEM)数据集。伴随这些EM体积的是细胞内亚结构的自动分割和分析。 关键词:超大规模、电子显微镜、分割

BrixIA:COVID19严重程度评分评估数据库

4703张COVID19患者的胸部X光片,手动注释Brixia评分 关键词:大规模、X光、新冠

COVID-CT

从几篇COVID19相关论文中收集的349张CT图像 图像说明 关键词:中等规模、CT、新冠

肺炎X光

约5000张X光片 关键词:中等规模、X光、肺炎

医学影像数据资源中心(MIDRC)

361名COVID阳性患者的998次胸部X光检查。 带有外观分类和气腔疾病分级的注释 临床变量 关键词:大规模、X光、新冠

BIMCV-COVID19

1350多张X光片,150多张CT,800个诊断 关键词:中等规模、CT、新冠

MosMedData Covid19

1000多张COVID19患者的CT 50张按像素注释 关键词:大规模、CT、新冠、分割

COVID-19肺部CT病变分割挑战赛

约250张SARS-CoV-2 RT-PCR阳性的胸部CT,带有COVID-19病变注释 关键词:中等规模、CT、新冠、注释、分割

MedSeg COVID-19 CT

约100张分割的CT切片 关键词:中等规模、CT、分割、新冠

COVID-胸部X光

约150张X光片,持续更新,部分医院数据 关键词:中等规模、X光、新冠

BSTI COVID19

持续更新,上次检查时约60名患者,CT 论文PDF 关键词:中等规模、CT、新冠

叙事性功能磁共振成像

345名受试者、891次功能扫描,以及27个不同时长的多样化故事,总计约4.6小时的独特刺激(约43,000字)。 Nature论文 关键词:中等规模,功能磁共振成像

RICORD

1000张X光片和240张CT扫描,附带标注(论文关键词:大规模,CT,新冠肺炎,分割

FIRE(眼底图像配准数据集)

129张视网膜图像。 关键词:小规模,眼底

DRIVE:用于血管提取的数字视网膜图像

40张带分割的视网膜图像 关键词:小规模,视网膜,分割

FLARE:快速低GPU内存腹部器官分割

来自11+个国家的500多次CT扫描,包含腹部器官分割(肝脏、肾脏、脾脏和胰腺) 关键词:大规模,腹部,CT

ADNI

各种成像(纵向MRI)、遗传学、临床数据 数千名患者 关键词:大规模,MRI,遗传学,临床

VISCERAL

约120个图像卷(全身CT和MRI图像) 超过1900个已标注的解剖结构 关键词:中等规模,MRI,CT,全身,手动分割

Mindboggle

似乎有101个手动标记的大脑MRI 关键词:中等规模,MRI,大脑,手动分割

跨部门词汇处理横断面研究

3000次脑部扫描(T1w、bold、事件) 标准化测试、分数、人口统计学 关键词:大规模,MRI,功能磁共振成像,测试

杜克乳腺癌筛查DBT

来自5,060名患者的数字乳腺断层合成图像精选数据集。 关键词:大规模,断层合成,DBT,乳腺,检测

CBIS-DDSM(DDSM的精选乳腺影像子集)

2600多项扫描胶片乳腺摄影研究 关键词:大规模,X射线

Neuromorphometrics

63次手动标记的脑部扫描。 费用($1500?) 讨论 关键词:中等规模,MRI,大脑,手动分割,收费

自动非刚性组织学图像配准

这是ISBI2019的一项挑战

7特斯拉静息态功能磁共振成像

22名参与者,包括认知和生理测量,以及7T静息态功能磁共振成像

SpineWeb

跨多个数据集的200多名受试者(CT、X射线、MRI)

先天性心脏病3D心血管MRI中的全心脏和大血管分割

20例先天性心脏病心脏MR图像

儿童纵向神经影像学

论文 约50名儿童(约10岁),单次随访,包括MRI、功能磁共振成像和评估 关键词:中等规模,功能磁共振成像,纵向

儿童算术处理纵向神经影像学

论文 3T功能磁共振成像,132名典型发育儿童,2个时间点,4项任务 关键词:中等规模,功能磁共振成像,纵向

叙事

汇集了大约七年时间内获得的听觉故事聆听功能磁共振成像数据集 关键词:中等规模,功能磁共振成像

ATLAS:卒中后病变的解剖追踪

229次T1加权MRI扫描(n=220),带有病变分割 MNI152标准空间T1加权平均结构模板图像 包含病变元数据的.csv文件 论文 关键词:中等规模,MRI,分割

MITOS_WSI_CMC

21张犬乳腺癌全扫描图像。 由2/3名专家标注 关键词:小规模,2D,全扫描成像

FeTA数据集

48次手动标注的子宫内胎儿MR 关键词:小规模,MRI,胎儿,标签

SIMON

单个志愿者,在多个地点进行了73次扫描,时间跨度约17年 MRI,每次至少进行T1扫描,其他模态因会话而异。 提供表型文件 关键词:小规模,MRI,纵向研究

BigBrain

单个体积,组织学空间,100微米分辨率,包含灰质/白质表面和皮层层 ftp://bigbrain.loris.ca | 交互式 关键词:小规模,组织学,高分辨率,分割

100微米人脑MRI

单个体积,超高分辨率MRI数据集(100微米) 关键词:小规模,MRI,大脑

自然场景数据集(CMRR计划)

8名受试者大规模fMRI(40次会话,高采样率,高分辨率)。T1加权,T2加权,T2*加权MRI 视频描述 关键词:小规模,MRI,大脑,fMRI

大脑目录

不同动物的(离体)大脑MRI或大脑 关键词:小规模,MRI,大脑,动物

多壳层扩散

健康旅行成年人的三次扩散 关键词:小规模,MRI,扩散,大脑

产前MRI

产前大脑MRI样本(似乎是单个受试者?) 关键词:小规模,MRI,胎儿

BCNB:早期乳腺癌粗针活检全扫描图像数据集

1058张全扫描图像(WSIs)及相应的临床特征 部分肿瘤区域在WSIs中已标注 临床特征包括年龄、肿瘤大小、肿瘤类型、ER、PR、HER2、HER2表达、组织学分级、手术、Ki67、分子亚型、淋巴结转移数量和ALN状态 论文参考 关键词:大规模,乳腺癌,多模态,WSI,临床特征

BCI:乳腺癌免疫组织化学图像生成数据集

4870对配准的HE-IHC图像对,涵盖HER2的四个表达水平(0、1+、2+、3+) 关键词:大规模,乳腺癌,HE,IHC

非影像

PhysioNet / 基于MIMIC-CXR的肺水肿严重程度分级

该数据集基于MIMIC-CXR整理,包含3个元数据文件,其中包含通过不同方式从MIMIC-CXR数据集中提取的肺水肿严重程度分级:1)通过正则表达式(regex)从放射学报告中提取,2)由专家从放射学报告中标注,3)通过胸部X光片的共识标注 关键词:肺水肿,严重程度分级,胸部X光,放射学报告,MIMIC-CXR

PhysioNet / 2019年计算心脏病学挑战赛

预测ICU人群中的脓毒症 来自三个不同医院系统的5000名ICU患者

eICU-CRD

详细记录了美国200多家医院超过200,000次重症监护入院的信息 获得MIMIC访问权限后,可在签署更新的数据使用协议后立即访问eICU-CRD 论文

非医学但有用/有趣

时刻

其他列表或汇集资源(相关xkcd)

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多