botpress_Vaganet_new_model

项目介绍: botpress_Vaganet_new_model

背景概述

botpress_Vaganet_new_model是一个基于SetFit的文本分类模型，该项目使用的是sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2作为句子嵌入模型，并采用Logistic Regression进行分类。它具备多语言支持，能够处理不同语言的文本输入。

模型细节

模型描述

模型类型: SetFit
句子嵌入模型: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
分类器: Logistic Regression 实例
最大序列长度: 128个标记
类别数量: 34种类别

训练技术

该模型使用了一种高效的少样本学习技术，包括：

通过对比学习微调句子转换器。
利用微调后的特征来训练分类头。

模型来源

GitHub项目库: SetFit on GitHub
相关论文: Efficient Few-Shot Learning Without Prompts
博客文章: SetFit: Efficient Few-Shot Learning Without Prompts

标签与用途

模型能对多种操作请求进行分类，例如请求资产的利用率报告、请求资产的转移、检查资产的功能状况、请求资产的修复等等。具体分类标签和示例如下：

请求资产利用报告 (例如 "如何请求投影仪的利用率报告？")
请求资产转移 (例如 "转移发电机的步骤是什么？")
检查资产安全状态 (例如 "可以检查打印机的安全状态吗？")

评估与指标

准确性

该模型在分类任务中的准确度达到了约88.97%的准确率。

使用方法

直接使用来进行推断

首先需要安装SetFit库：

pip install setfit

然后可以加载此模型并进行推断：

from setfit import SetFitModel

# 从🤗 Hub下载模型
model = SetFitModel.from_pretrained("Decius/botpress_Vaganet_new_model")
# 进行推断
preds = model("L'ordinateur portable est-il libre à l'instant?")