最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

bilingual-embedding-large

bilingual-embedding-large

文本嵌入多语言模型

基于Transformer架构的法英双语文本向量模型

German_Semantic_STS_V2

German_Semantic_STS_V2

GithubBERT

德语语义相似度计算模型 实现文本搜索与聚类

safety-flan-t5-base

safety-flan-t5-base

Pytorch机器学习

开源对话内容安全评估模型FLAN-T5

UnslopNemo-12B-v3-GGUF

UnslopNemo-12B-v3-GGUF

UnslopNemo模型表现

实验性Mistral对话模型的增强表达版本

twitter-roberta-base-dec2021-tweet-topic-multi-all

twitter-roberta-base-dec2021-tweet-topic-multi-all

多标签分类文本分类

基于RoBERTa的多标签推文主题分类模型

EuroLLM-1.7B-Instruct

EuroLLM-1.7B-Instruct

神经网络多语言模型

支持35种语言的欧洲开源大语言模型

jina-embeddings-v2-base-es

jina-embeddings-v2-base-es

特征提取开源项目

双语智能文本嵌入模型 英语和西班牙语文本向量化解决方案

autonlp-Tweet-Sentiment-Extraction-20114061

autonlp-Tweet-Sentiment-Extraction-20114061

机器学习AutoNLP

AutoNLP推文情感分析模型达80%准确率

tiny-random-BertModel

tiny-random-BertModel

机器学习人工智能

轻量级随机初始化BERT模型

Yi-1.5-9B-Chat

Yi-1.5-9B-Chat

机器学习人工智能

开源语言模型在编码、数学和推理能力方面表现卓越

long-t5-tglobal-base

long-t5-tglobal-base

注意力机制开源项目

LongT5模型:基于transient-global注意力的长序列文本转换器

bert-base-turkish-cased-ner

bert-base-turkish-cased-ner

土耳其语言模型Github

土耳其语BERT命名实体识别模型实现99.61%准确率

falcon-11B

falcon-11B

Falcon2-11B语言模型

11种语言支持的大规模语言模型,基于5000亿数据训练打造

jina-embeddings-v2-base-zh

jina-embeddings-v2-base-zh

模型评估句子相似度

基于Transformer的中文文本向量模型,适用于语义检索和相似度计算

indic-bert

indic-bert

IndicBERT多语言模型

专注印度12种语言的轻量级ALBERT预训练模型

twitter-roberta-base-emotion

twitter-roberta-base-emotion

Huggingface开源项目

基于RoBERTa的推特情绪识别与分析模型

stsb-bert-base

stsb-bert-base

句向量Github

基于BERT的文本向量化和语义相似度分析工具

roberta-base-japanese-with-auto-jumanpp

roberta-base-japanese-with-auto-jumanpp

开源项目日语模型

日语RoBERTa预训练语言模型

bert-large-cased-whole-word-masking-finetuned-squad

bert-large-cased-whole-word-masking-finetuned-squad

BERT问答系统

全词掩码BERT大型模型在SQuAD数据集上优化的问答系统

muril-large-cased

muril-large-cased

多语言开源项目

支持17种印度语言的BERT大规模预训练模型