最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

sat-3l-sm

sat-3l-sm

模型Github

基于Transformer的多语言句子分割模型

text_summarization

text_summarization

模型开源项目

基于T5 Small的文本摘要模型

Phi-3-medium-4k-instruct

Phi-3-medium-4k-instruct

模型Github

轻量级多任务语言模型

graphcodebert-base

graphcodebert-base

模型GraphCodeBERT

GraphCodeBERT结合数据流信息的代码预训练模型

paraphrase-xlm-r-multilingual-v1

paraphrase-xlm-r-multilingual-v1

模型向量嵌入

多语言句子嵌入模型 生成768维向量用于相似度计算

CodeBERTa-small-v1

CodeBERTa-small-v1

模型Github

基于RoBERTa架构的多语言代码理解模型

distilbert-base-multilingual-cased-ner-hrl

distilbert-base-multilingual-cased-ner-hrl

模型Github

DistilBERT微调的10语种命名实体识别模型

Qwen2-7B

Qwen2-7B

Huggingface模型

开源大语言模型在多项基准测试中展现优异性能

Solon-embeddings-large-0.1

Solon-embeddings-large-0.1

模型信息检索

法语嵌入模型Solon在多项自然语言处理任务中表现优异

deberta-v2-base-japanese

deberta-v2-base-japanese

模型DeBERTa V2

日语DeBERTa V2 base模型:为自然语言处理提供强大基础

IndicNER

IndicNER

模型IndicNER

面向11种印度语言的多语言命名实体识别模型

fasttext-en-vectors

fasttext-en-vectors

模型文本分类

多语言词向量学习和文本分类开源库

bert-base-french-europeana-cased

bert-base-french-europeana-cased

模型法语

基于欧洲数字图书馆的法语BERT模型

Meta-Llama-3-70B

Meta-Llama-3-70B

Llama 3大型语言模型

Meta发布Llama 3开源大语言模型系列

bert-base-german-cased

bert-base-german-cased

Huggingface模型

高性能德语BERT模型助力自然语言处理应用

bertweet-pt-sentiment

bertweet-pt-sentiment

pysentimiento模型

基于BERTabaporu的葡萄牙语情感分析模型

Qwen2.5-1.5B

Qwen2.5-1.5B

模型Qwen2.5

多语言支持的15亿参数基础语言模型

mrebel-large

mrebel-large

模型Github

基于序列到序列学习的多语言关系抽取模型

blip2-flan-t5-xl

blip2-flan-t5-xl

模型Github

融合视觉和语言的多功能预训练模型用于图像理解和多模态任务

CodeLlama-13b-Instruct-hf

CodeLlama-13b-Instruct-hf

模型模型训练

Code Llama系列中的130亿参数指令调优模型