PyTorch文本分类基准测试
我们正在尝试为文本分类建立一个基准测试,包括:
多个文本分类数据集,包括情感/主题分类,常用语言(如英语和中文)。同时提供基本的词嵌入。
实现许多流行和最先进的模型,特别是深度神经网络。
我们已完成一些数据集和模型
你应该安装这些库
<pre> python3 torch torchtext (可选) </pre>数据集将自动在当前路径配置,或者按照数据集中的步骤手动下载你的数据。
包括
<pre> Glove嵌入 情感分类数据集IMDB </pre>使用默认设置运行
<pre><code>python main.py</code></pre>CNN
<pre><code>python main.py --model cnn</code></pre>LSTM
<pre><code>python main.py --model lstm</code></pre>该仓库的核心是模型和数据集。
dataloader/
: 加载所有数据集,如IMDB
、SST
models/
: 创建所有模型,如FastText
、LSTM
、CNN
、Capsule
、QuantumCNN
、Multi-Head Attention
opts.py
: 参数和配置信息
utils.py
: 工具
dataHelper
: 数据助手
欢迎提出问题和贡献!
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。