最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

e5-base-v2

e5-base-v2

模型评估Sentence Transformers

多任务训练的自然语言处理模型

SapBERT-UMLS-2020AB-all-lang-from-XLMR

SapBERT-UMLS-2020AB-all-lang-from-XLMR

Huggingface模型

跨语言生物医学实体表示学习框架

bert-mini

bert-mini

模型BERT

轻量级BERT模型为下游NLP任务提供高效解决方案

gpt-j-6b

gpt-j-6b

模型GPT-J 6B

基于The Pile数据集训练的60亿参数大规模语言模型

bart_finetuned_keyphrase_extraction

bart_finetuned_keyphrase_extraction

模型Github

BART微调模型实现多领域关键短语自动提取

tiny-random-Phi3ForCausalLM

tiny-random-Phi3ForCausalLM

模型Phi3ForCausalLM

轻量级Phi3因果语言模型实现

gemma-7b

gemma-7b

模型人工智能

Google推出的轻量级开源大语言模型

FinBERT-PT-BR

FinBERT-PT-BR

Huggingface模型

巴西金融市场智能文本情感分析的先进模型

esm2_t6_8M_UR50D

esm2_t6_8M_UR50D

模型生物信息学

ESM-2系列最小规模蛋白质序列预训练模型

roberta-large-ontonotes5

roberta-large-ontonotes5

Huggingface模型

RoBERTa-large模型在OntoNotes 5数据集上的高性能命名实体识别微调版本

vram-16

vram-16

模型Github

低内存高效的视觉语言模型

robbert-v2-dutch-ner

robbert-v2-dutch-ner

语言模型模型

RobBERT:用于荷兰语自然语言处理的先进预训练模型

xlm-r-100langs-bert-base-nli-stsb-mean-tokens

xlm-r-100langs-bert-base-nli-stsb-mean-tokens

嵌入向量Huggingface

已弃用的多语言句子嵌入模型用于语义相似度任务

Llama-2-7b-chat-hf

Llama-2-7b-chat-hf

模型Llama 2

开源对话模型 强大性能与安全性兼备

flan-t5-base

flan-t5-base

模型多语言

基于T5架构的多语言文本生成模型

fasttext-language-identification

fasttext-language-identification

模型文本分类

轻量级开源库实现217种语言的快速准确识别

intent-model

intent-model

Huggingface模型

Danswer项目的智能用户意图分类模型

deberta-large

deberta-large

语言模型Huggingface

DeBERTa模型利用解耦注意力机制提升自然语言理解能力

t5-v1_1-xl

t5-v1_1-xl

Huggingface模型

Google T5-v1_1-xl:优化的大规模预训练语言模型

Qwen1.5-1.8B

Qwen1.5-1.8B

Huggingface模型

多语言大规模语言模型支持32K上下文长度