ShenNong-TCM:首个中医药领域大规模语言模型的诞生与发展

RayRay
中医药大模型ShenNong-TCM-LLM自然语言处理指令数据集知识图谱Github开源项目

ShenNong-TCM:中医药智能化的新篇章

在人工智能快速发展的今天,大语言模型(Large Language Model, LLM)正在各个领域掀起一场革命。随着ChatGPT、GPT-4等模型的出现,LLM展现出了类似通用人工智能(AGI)的能力,引发了业界的广泛关注。然而,在专业领域,尤其是中医药这样具有深厚文化底蕴和独特理论体系的领域,通用模型往往难以满足特定需求。为了推动LLM在中医药领域的发展和应用,提升其在中医药知识方面的理解和回答能力,同时助力中医药传统知识的传承与创新,一个专门针对中医药领域的大规模语言模型应运而生——这就是ShenNong-TCM。

ShenNong-TCM Banner

ShenNong-TCM的诞生背景

ShenNong-TCM是由一群致力于将人工智能技术应用于中医药领域的研究者开发的。这个项目的名字"神农"源自中国传说中的神农氏,他被誉为中国农业和中药学的创始人。选择这个名字,体现了开发团队希望通过现代技术传承和发展中医药古老智慧的美好愿景。

ShenNong-TCM的主要目标包括:

  1. 提升LLM在中医药领域的知识储备和理解能力
  2. 增强模型回答中医药相关咨询的准确性和专业性
  3. 推动大模型技术在中医药传承与创新中的应用

ShenNong-TCM的技术特点

ShenNong-TCM模型的开发融合了多项创新技术:

  1. 专业数据集: 模型的训练数据来自中医药指令数据集ShenNong_TCM_Dataset,这是一个专门为中医药领域设计的高质量数据集。

  2. 知识图谱支持: 训练数据以开源的中医药知识图谱为基础,确保了模型对中医药核心概念和关系的准确理解。

  3. 创新的自指令方法: 研究团队提出了"以实体为中心的自指令方法"(entity-centric self-instruct),通过围绕中医药领域的核心实体和不同意图场景生成指令数据。这种方法极大地丰富了训练数据的多样性和针对性。

  4. 先进的模型架构: ShenNong-TCM以LlaMA为底座模型,采用LoRA(rank=16)进行参数高效微调,在保持模型性能的同时,大大减少了计算资源的需求。

ShenNong-TCM的应用价值

ShenNong-TCM在多个方面展现出了其独特的应用价值:

  1. 中医药知识问答: 模型可以准确回答各种中医药相关问题,从基础理论到临床应用,为学习者和从业者提供便捷的知识获取渠道。

  2. 中医诊断辅助: 通过分析用户描述的症状,ShenNong-TCM能够提供初步的中医诊断建议,协助医生进行更精准的诊断。

  3. 个性化保健指导: 基于中医养生理论,模型可以为用户提供个性化的健康建议和养生方案。

  4. 中药处方推荐: 对于常见症状,ShenNong-TCM能够推荐适当的中药方剂,但同时也会提醒用户在使用前咨询专业医生。

  5. 中医药研究支持: 模型可以辅助研究人员进行文献检索、数据分析等工作,加速中医药现代化研究的进程。

ShenNong-TCM的效果展示

为了直观地展示ShenNong-TCM的性能,研究团队进行了与中文LlaMA-7b模型的对比测试。以下是几个典型问题的回答对比:

问诊问题中文LlaMA-7bShenNong-TCM
腹痛怎么办啊?建议您尽快就医,并根据医生的指导进行治疗。如果您感到腹部疼痛,以下是一些可能有用的建议:<br>1. 首先休息一下。躺下或坐下来可以减轻症状并帮助身体恢复力量。<br>2. 如果您有任何药物过敏史或者正在服用其他药品,请务必咨询医生的意见后再使用这些药膏、止疼剂等缓解痛苦的方法。<br>3. 在饮食方面,避免食用辛辣食物和油腻食品,尽量选择清淡易消化的食物来减少肠胃负担。同时多喝水以保持水分平衡。<br>4. 如果你的情况比较严重并且持续时间较长,最好去医院就诊寻求专业治疗。
可以给我介绍一些治疗太阳经风寒证的中药吗?针灸、推拿等中医疗法,以及草药汤剂都可以用来缓解这种症状。当出现太阳经风寒证时,可以考虑以下几种常用的中药进行治疗。这些药物具有温阳散寒、祛湿止痛的作用,能够缓解症状并促进身体康复。<br><br>1. 当归(Angelica sinensis)-有活血化瘀和补气养血作用;<br>2. 白芷 (Bai Zi) - 清热解毒,宣通鼻窍;<br>3. 金银花(Honeysuckle, Jin Xin Hua)-清热解毒,凉血消肿;<br>4. 陈皮 (Chen Pi) - 理气健脾,行滞化痰;<br>5. 桂枝 (Gui Zhi) - 发汗解表,调和营卫。<br><br>需要注意的是,在使用任何一种中药之前应该咨询医生或中医师的意见以确保安全有效性。

从这些对比中我们可以看出:

  1. ShenNong-TCM的回答更加详细和专业,不仅给出了具体的建议,还解释了每个建议的原因。
  2. 在推荐中药时,ShenNong-TCM不仅列出了药名,还介绍了每种药物的功效,体现了其对中医药知识的深入理解。
  3. ShenNong-TCM的回答更具人性化,会提醒用户注意事项,如咨询医生意见,体现了负责任的态度。

ShenNong-TCM的未来发展

尽管ShenNong-TCM已经展现出了令人瞩目的性能,但开发团队认识到,这只是中医药智能化的开始。他们计划在以下几个方面继续改进和扩展ShenNong-TCM:

  1. 数据持续更新: 不断扩充和优化中医药指令数据集,以涵盖更广泛的中医药知识和临床案例。
  2. 多模态融合: 将图像识别等技术融入模型,使其能够分析中药材图片、舌诊图像等多模态数据。
  3. 个性化定制: 开发能够根据用户个人体质和健康状况提供更精准建议的个性化模型。
  4. 跨语言能力: 增强模型的多语言处理能力,促进中医药知识的国际传播。
  5. 伦理和安全: 进一步完善模型的伦理约束和安全机制,确保其在医疗健康领域的负责任使用。

结语

ShenNong-TCM的诞生,标志着中医药领域人工智能应用的一个重要里程碑。它不仅为中医药知识的传播和应用提供了新的途径,也为中医药与现代科技的深度融合开辟了新的可能性。我们期待看到ShenNong-TCM在未来能够在中医药教育、临床实践、科研创新等多个领域发挥重要作用,为中医药事业的发展贡献力量。

同时,我们也应该认识到,ShenNong-TCM作为一个AI模型,其作用是辅助和补充,而非替代专业医疗人员。在使用这类模型时,我们始终需要保持谨慎和理性,将其作为获取初步信息和建议的工具,而关键的诊断和治疗决策仍应由经过专业训练的医生来完成。

随着技术的不断进步和模型的持续优化,我们有理由相信,ShenNong-TCM将为中医药这一古老而富有智慧的医学体系注入新的活力,助力中医药在新时代焕发出更加璀璨的光彩。

🔗 相关链接:

📚 参考文献:

  1. Zhu, W., Yue, W., & Wang, X. (2023). ShenNong-TCM: A Traditional Chinese Medicine Large Language Model. GitHub repository. https://github.com/michael-wzhu/ShenNong-TCM-LLM

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多