最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

twitter-xlm-roberta-base-sentiment

twitter-xlm-roberta-base-sentiment

模型Github

基于XLM-roBERTa的多语言推特情感分析模型

beto-sentiment-analysis

beto-sentiment-analysis

BETO模型

基于BETO的西班牙语情感分析开源模型

distilbert-base-nli-mean-tokens

distilbert-base-nli-mean-tokens

模型语义搜索

基于DistilBERT的句子嵌入模型用于文本聚类和语义搜索

ms-marco-electra-base

ms-marco-electra-base

模型Github

ELECTRA跨编码器模型提升MS Marco信息检索效率

t5-large

t5-large

模型多任务学习

统一文本到文本格式的大规模多语言NLP模型

MeaningBERT

MeaningBERT

模型语义保留

智能评估句子间语义保留的自动化指标

gpt2-medium

gpt2-medium

语言模型Transformer

OpenAI开发的中型GPT-2语言模型用于多样化文本生成

codebert-base

codebert-base

CodeBERTHuggingface

CodeBERT为编程与自然语言处理提供强大支持

nomic-embed-text-v1.5

nomic-embed-text-v1.5

模型Github

先进的文本嵌入模型用于语义分析和相似度计算

finbert-tone

finbert-tone

BERT模型模型

专业金融文本情感分析预训练模型

siglip-base-patch16-224

siglip-base-patch16-224

模型计算机视觉

SigLIP改进CLIP模型 实现更高效的零样本图像分类和检索

Qwen2.5-72B-Instruct

Qwen2.5-72B-Instruct

模型Qwen2.5

支持长文本和多语言的720亿参数语言模型

GIST-all-MiniLM-L6-v2

GIST-all-MiniLM-L6-v2

模型评估文本相似度

多语言句子相似度和特征提取模型

tiny-random-Llama-3

tiny-random-Llama-3

模型开源

基于Meta-Llama-3-8B-Instruct的微型化语言模型

jina-embeddings-v2-small-en

jina-embeddings-v2-small-en

模型Github

英文句子嵌入模型用于多种自然语言处理任务

Mistral-7B-v0.1

Mistral-7B-v0.1

文本生成Huggingface

超越Llama 2的开源大语言模型

bert_turkish_sentiment

bert_turkish_sentiment

土耳其语Huggingface

微调TurkishBERTweet的高精度土耳其语情感分析模型

keyphrase-extraction-distilbert-inspec

keyphrase-extraction-distilbert-inspec

关键词提取Inspec数据集

DistilBERT驱动的科学文献关键短语提取模型

gemma-2b

gemma-2b

模型人工智能

轻量级开源语言模型实现高效文本生成

mbart-large-50-many-to-many-mmt

mbart-large-50-many-to-many-mmt

多语言机器翻译Github

mBART-50多语言机器翻译模型实现50种语言直接互译