MentaLLaMA:开创性的可解释心理健康分析大语言模型

RayRay
MentaLLaMA大语言模型心理健康分析社交媒体可解释性Github开源项目

MentalLLaMA

MentaLLaMA:开创性的可解释心理健康分析大语言模型

随着社交媒体的普及,人们在网上分享的内容成为了解其心理健康状况的重要窗口。然而,如何从海量的社交媒体文本中准确分析用户的心理健康状况,一直是一个具有挑战性的研究课题。近期,来自英国曼彻斯特大学的研究团队开发了一个名为MentaLLaMA的创新性大语言模型,为这一领域带来了新的突破。

MentaLLaMA的诞生背景

传统的心理健康分析方法主要依赖于判别模型,虽然可以给出分类结果,但缺乏可解释性。随着ChatGPT等大语言模型的兴起,研究人员开始探索将其应用于可解释的心理健康分析。然而,现有的大语言模型在零样本或少样本场景下的分类性能并不理想。

为了解决这些问题,研究团队提出了MentaLLaMA项目。该项目的目标是开发一个开源的、具有指令跟随能力的大语言模型,专门用于社交媒体上的可解释心理健康分析。

IMHI数据集:MentaLLaMA的基石

MentaLLaMA的成功离不开高质量的训练数据。研究团队构建了IMHI(Interpretable Mental Health Instruction)数据集,这是第一个多任务、多来源的可解释心理健康分析指令调优数据集。IMHI包含105K条指令样本,涵盖了8个心理健康分析任务。

IMHI数据集示例

IMHI数据集的构建过程如下:

  1. 从10个现有数据集中收集原始社交媒体数据,涵盖抑郁检测、压力检测、心理障碍检测等8个任务。
  2. 使用专家编写的少样本提示和收集的标签来引导ChatGPT生成解释。
  3. 对生成的数据进行严格的自动评估和人工评估,确保解释的正确性、一致性和质量。

MentaLLaMA模型架构

MentaLLaMA基于LLaMA2基础模型,通过在IMHI数据集上进行指令微调而来。研究团队提供了多个版本的模型检查点:

  • MentaLLaMA-33B-lora:基于Vicuna-33B模型,使用LoRA技术进行微调
  • MentaLLaMA-chat-13B:基于LLaMA2-chat-13B模型
  • MentaLLaMA-chat-7B:基于LLaMA2-chat-7B模型
  • MentalBART:基于BART-large模型,用于完成式任务
  • MentalT5:基于T5-large模型,用于完成式任务

这些模型可以通过Hugging Face Transformers库轻松加载和使用。例如:

from transformers import LlamaTokenizer, LlamaForCausalLM tokenizer = LlamaTokenizer.from_pretrained('klyang/MentaLLaMA-chat-13B') model = LlamaForCausalLM.from_pretrained('klyang/MentaLLaMA-chat-13B', device_map='auto')

MentaLLaMA的评估

为了全面评估MentaLLaMA的性能,研究团队构建了一个包含19K测试样本的评估基准。评估内容包括两个方面:

  1. 分类正确性:使用基于MentalBERT的神经网络分类器来评估模型生成的解释是否能正确分类。

  2. 解释质量:使用BART-score等自动评估指标来评估生成解释的质量。研究还进行了人工标注,评估了解释的流畅性、完整性、可靠性等方面。

MentaLLaMA评估流程

评估结果表明,MentaLLaMA在分类正确性上接近最先进的判别方法,同时能生成高质量的解释。

MentaLLaMA的应用前景

MentaLLaMA为社交媒体上的心理健康分析提供了新的可能性:

  1. 自动化筛查:可以快速分析大量社交媒体文本,识别潜在的心理健康问题。

  2. 可解释性分析:不仅给出分类结果,还提供详细解释,有助于理解用户的心理状态。

  3. 多任务分析:一个模型可以完成多种心理健康分析任务,如抑郁检测、压力检测等。

  4. 辅助诊断:为心理健康专业人员提供初步分析结果,辅助临床诊断。

  5. 心理健康监测:可用于构建实时心理健康监测系统,及早发现潜在问题。

然而,研究团队也强调,MentaLLaMA的预测结果和解释仅供非临床研究使用,不应替代专业精神病学家或临床医生的诊断。在实际应用中,还需要考虑伦理、隐私保护等多方面因素。

结语

MentaLLaMA的出现标志着可解释心理健康分析进入了一个新的阶段。它不仅展示了大语言模型在特定领域应用的潜力,也为心理健康研究提供了新的工具和方法。未来,随着模型的进一步优化和更多领域专家的参与,我们有理由期待MentaLLaMA能在心理健康分析和干预中发挥更大的作用,为促进公众心理健康做出贡献。

编辑推荐精选

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成AI工具AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机AI图像热门
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
下拉加载更多