最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

umberto-commoncrawl-cased-v1

umberto-commoncrawl-cased-v1

意大利语言模型开源项目

高性能意大利语预训练语言模型 支持全词遮蔽技术

paraphrase-distilroberta-base-v2

paraphrase-distilroberta-base-v2

语义搜索向量嵌入

DistilRoBERTa句子向量模型用于文本相似度和语义分析

bert-base-cased-squad2

bert-base-cased-squad2

开源项目BERT

BERT模型实现英文文本智能问答与信息提取

BLEURT-20

BLEURT-20

Github开源项目

基于深度学习的文本相似度智能评估工具

gliner_medium-v2.1

gliner_medium-v2.1

Github开源项目

多功能通用型命名实体识别模型GLiNER

vietnamese-sbert

vietnamese-sbert

语义相似度Github

基于SBERT的越南语句子相似度与语义分析模型

bloomz-7b1

bloomz-7b1

开源项目bloomz

突破性的多语言开源预训练语言模型

roberta-base-on-cuad

roberta-base-on-cuad

Github开源项目

智能合同审查模型基于CUAD数据集 提升法律文档分析效率

distilroberta-bias

distilroberta-bias

文本分类偏见检测

基于DistilROBERTA架构实现的文本偏见智能识别

calm3-22b-chat

calm3-22b-chat

CALM3-22B-Chat开源项目

基于22亿参数的日英双语对话模型,专为智能交互优化

Mistral-Ita-7b

Mistral-Ita-7b

意大利语言模型开源项目

基于Mistral架构的意大利语自然语言处理模型

bart-paraphrase

bart-paraphrase

开源项目自然语言处理

BART大型语言模型文本释义转换工具

mt5-xxl

mt5-xxl

Github开源项目

基于mC4语料库的大规模多语言文本转换模型

mGPT

mGPT

GPTMegatron

基于GPT架构的大规模多语种自然语言处理模型

tapas-tiny-finetuned-sqa

tapas-tiny-finetuned-sqa

TAPAS语义分析

TAPAS表格问答模型实现多轮对话式表格数据查询

Qwen2.5-14B

Qwen2.5-14B

Qwen2.5Github

基于transformer架构的多语言预训练模型 具备超长文本理解能力

hebert-finetuned-hebrew-metaphor

hebert-finetuned-hebrew-metaphor

heBERT开源项目

heBERT微调模型实现希伯来语隐喻检测 准确率达95.10%

twitter-roberta-base-offensive

twitter-roberta-base-offensive

推特数据开源项目

基于roBERTa的推特攻击性语言识别模型

paraphrase-TinyBERT-L6-v2

paraphrase-TinyBERT-L6-v2

TinyBERTGithub

轻量级句子嵌入模型支持语义搜索与文本聚类

chatgpt_paraphraser_on_T5_base

chatgpt_paraphraser_on_T5_base

ChatGPTGithub

开源模型实现ChatGPT级文本改写功能