SetFit文本分类模型的高效少样本学习
SetFit结合sentence-transformers/paraphrase-mpnet-base-v2,实现高效的文本分类,使用对比学习和LogisticRegression,总体准确率达96.7%。该模型经过优化学习率和损失函数,适用于多种文本分析场景。
amd-partial-v1 是一个基于 SetFit 框架的文本分类项目。SetFit 是一种高效的少样本学习技术,专注于通过对句子变换模型的对比学习进行微调,然后使用一个逻辑回归分类头进行分类。该项目的主要目标是对文本进行分类。
sentence-transformers/paraphrase-mpnet-base-v2
amd-partial-v1 模型的整体准确率达到了 96.76%。
要使用此模型进行推理,首先需要安装 SetFit 库:
pip install setfit
然后加载模型并进行推理:
from setfit import SetFitModel # 从 HuggingFace 中心下载模型 model = SetFitModel.from_pretrained("nikcheerla/amd-partial-v1") # 运行推理 preds = model("Hello?")
训练过程中的损失和验证损失变化如下:
轮次 | 步骤 | 训练损失 | 验证损失 |
---|---|---|---|
0.0002 | 1 | 0.274 | - |
1.0 | 4934 | 0.0021 | 0.0615 |
2.0 | 9868 | 0.0126 | 0.065 |
3.0 | 14802 | 0.0206 | 0.065 |
如果需要引用这项研究,可以使用以下 BibTeX 格式:
@article{https://doi.org/10.48550/arxiv.2209.11055, doi = {10.48550/ARXIV.2209.11055}, url = {https://arxiv.org/abs/2209.11055}, author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren}, keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences}, title = {Efficient Few-Shot Learning Without Prompts}, publisher = {arXiv}, year = {2022}, copyright = {Creative Commons Attribution 4.0 International} }
通过这种技术,项目在文本分类上取得了卓越的结果,为文本数据处理提供了一种高效而简单的方法。
AI数字人视频创作平台
Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企 业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。
一站式AI创作平台
提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作
AI办公助手,复杂任务高效处理
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!
AI辅助编程,代码自动 修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI小说写作助手,一站式润色、改写、扩写
蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。