MedAlpaca: 开源医疗问答人工智能模型的突破性进展

MedAlpaca项目概述

MedAlpaca是一个旨在为医疗领域提供开源大型语言模型的创新项目。该项目在Stanford Alpaca和AlpacaLoRA的基础上,开发了一系列专门针对医疗问答和对话应用进行微调的语言模型。MedAlpaca的主要目标是提供一套开源语言模型,为医疗聊天机器人等应用的开发铺平道路。

这些模型使用了多种医学文本进行训练,包括医学抗菌素卡片、医学百科和对话数据集等资源。通过对这些专业医学数据的学习,MedAlpaca模型能够更好地理解和回答医学领域的问题。

MedAlpaca项目概览

技术实现

环境配置

要开始使用MedAlpaca,首先需要配置适当的环境。建议使用conda创建一个新的虚拟环境:

conda create -n medalpaca python>=3.9

然后安装所需的依赖包:

pip install -r requirements.txt

模型训练

MedAlpaca的训练过程主要基于LLaMA模型。如果你有访问LLaMA或Alpaca权重的权限,可以使用以下命令对模型进行微调:

python medalpaca/train.py \
    --model PATH_TO_LLAMA_WEIGHTS \
    --data_path medical_meadow_small.json \
    --output_dir 'output' \
    --train_in_8bit True \
    --use_lora True \
    --bf16 True \
    --tf32 False \
    --fp16 False \
    --global_batch_size 128 \
    --per_device_batch_size 8

这个脚本默认执行混合精度训练。你可以通过train_in_8bit标志来切换8位训练。虽然8位训练目前只能与use_lora True一起使用,但你可以在不使用8位训练的情况下使用LoRA。此脚本也能用于训练其他模型,如facebook/opt-6.7。

内存需求

研究团队对在单个GPU上微调LLaMA 7b模型所需的GPU内存和每个epoch的大致持续时间进行了基准测试。以下是使用Medical Meadow小数据集(约6000个问答对)的结果:

模型	8位训练	LoRA	fp16	bf16	使用的VRAM	梯度检查点	每轮时长
LLaMA 7b	True	True	True	False	8.9 GB	False	77:30
LLaMA 7b	False	True	True	False	18.8 GB	False	14:30
LLaMA 7b	False	False	True	False	OOM	False	-
LLaMA 7b	False	False	False	True	79.5 GB	True	35:30
LLaMA 7b	False	False	False	False	OOM	True	-

这些基准测试结果为研究者和开发者提供了宝贵的参考,有助于他们根据自身的硬件条件选择合适的训练配置。

Medical Meadow数据集

为了确保模型能够获得高质量的医学知识,研究团队精心收集并整理了一系列生物医学开源数据集,并将其转化为指令调优格式。这个被称为"Medical Meadow"的数据集目前包含约150万个数据点,涵盖了多种任务类型。

Medical Meadow数据集概览

Medical Meadow数据集的主要组成部分包括:

医学抗菌素卡片
医学百科(Wikidoc)
患者信息
Stack Exchange问答(包括学术、生物学、健身、健康和生物信息学等领域)
USMLE自评测试
MEDIQA数据集
CORD-19研究挑战数据集
MMMLU数据集
PubMed健康建议
PubMed因果关系数据
ChatDoctor数据集
OpenAssistant数据集

这些数据来源的多样性确保了MedAlpaca模型能够获得全面的医学知识,从而在各种医疗相关的问答和对话任务中表现出色。

性能评估

为了评估MedAlpaca模型的性能,研究团队使用了USMLE(美国医师执照考试)自评测试作为基准。这个测试包含了Step 1、Step 2和Step 3三个阶段的问题,能够全面评估模型在医学领域的知识和推理能力。

MedAlpaca性能评估

以下是部分模型在USMLE自评测试中的表现:

模型	Step1	Step2	Step3
LLaMA 7b	0.198	0.202	0.203
Alpaca 7b naive	0.275	0.266	0.293
MedAlpaca 7b	0.297	0.312	0.398
MedAlpaca 13b	0.473	0.477	0.602
MedAlpaca 30b LoRA 8bit	0.315	0.327	0.361