最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

optimized-gpt2-250m

optimized-gpt2-250m

transformers开源项目

深入解析优化版GPT-2的模型特性与技术实现

bert-base-uncased-mrpc

bert-base-uncased-mrpc

BERT开源项目

BERT文本语义对比模型在MRPC数据集实现86%准确率

deberta-v3-xsmall-zeroshot-v1.1-all-33

deberta-v3-xsmall-zeroshot-v1.1-all-33

Huggingface开源项目

面向边缘设备的轻量级零样本文本分类模型

TinyStories-1M

TinyStories-1M

Github人工智能

基于百万量级数据训练的儿童故事生成语言模型

kpfbert

kpfbert

机器学习人工智能

面向韩语自然语言处理的BERT预训练模型

sentence-transformer-klue-temp

sentence-transformer-klue-temp

GithubColBERTv2

韩语句子转换模型的ColBERTv2实现方案

grammar-synthesis-small

grammar-synthesis-small

T5-small-lm-adapt文本校对

基于T5架构的自动语法纠正工具

distilbert-base-turkish-cased

distilbert-base-turkish-cased

BERT开源项目

轻量级高性能土耳其语BERT模型

mt0-small

mt0-small

自然语言处理多语言模型

支持百种语言的神经网络文本生成器

distilbert-base-german-cased

distilbert-base-german-cased

机器学习Github

轻量级德语BERT预训练模型

japanese-gpt-neox-3.6b

japanese-gpt-neox-3.6b

GPT-NeoX日语预训练

基于GPT-NeoX架构的36亿参数日语大语言模型

msmarco-distilbert-base-v3

msmarco-distilbert-base-v3

向量映射Github

基于DistilBERT的文本向量化模型支持语义搜索与文本聚类

MiniLMv2-L6-H384-distilled-from-BERT-Large

MiniLMv2-L6-H384-distilled-from-BERT-Large

开源项目自然语言处理

微软开发的轻量压缩型自然语言处理模型

mformer-authority

mformer-authority

transformers自然语言处理

基于Transformers的开源自然语言处理库

MiniLM-L12-H384-uncased

MiniLM-L12-H384-uncased

BERT开源项目

轻量快速的预训练语言模型实现BERT级别性能表现

bert-base-arabertv2

bert-base-arabertv2

阿拉伯语机器学习

阿拉伯语自然语言预训练模型 支持多任务场景应用

gpt-neox-20b

gpt-neox-20b

机器学习人工智能

EleutherAI开发的大规模开源语言模型

flair-arabic-multi-ner

flair-arabic-multi-ner

Huggingface命名实体识别

阿拉伯语命名实体识别模型实现86%准确率

roberta-base-snli

roberta-base-snli

SNLIRoBERTa

基于SNLI数据集训练且F1分值达0.9的自然语言推理模型

tweets-gender-classifier-distilbert

tweets-gender-classifier-distilbert

BERT谷歌

基于DistilBERT的推文作者性别分类模型