最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

bart-large-cnn

bart-large-cnn

模型开源项目

基于CNN Daily Mail数据集的先进文本摘要模型

camembert-base

camembert-base

模型Github

革新法语自然语言处理的先进模型

longformer-base-4096

longformer-base-4096

Huggingface注意力机制

专为长文档设计的Longformer transformer模型

bert-small

bert-small

模型BERT

轻量级BERT模型用于下游NLP任务优化

electra-base-discriminator

electra-base-discriminator

判别器transformers

创新的自监督语言表示学习模型

1

1

模型Github

开源自然语言处理工具库提升文本处理效率

all-MiniLM-L6-v2

all-MiniLM-L6-v2

自然语言处理sentence-transformers

高性能句子嵌入模型实现多种NLP任务

all-mpnet-base-v2

all-mpnet-base-v2

自然语言处理sentence-transformers

大规模训练的句子嵌入模型用于语义搜索和文本相似度

Llama-3.1-405B

Llama-3.1-405B

人工智能Github

Meta开发的多语言大规模语言模型集合,支持商业和研究使用

bert-base-uncased

bert-base-uncased

自然语言处理BERT

BERT基础版无大小写区分的预训练英语语言模型

roberta-base

roberta-base

人工智能机器学习

RoBERTa预训练语言模型用于多种自然语言处理任务

bge-small-en-v1.5

bge-small-en-v1.5

语义相似度文本分类

轻量级高性能英语句子嵌入模型

Qwen2.5-1.5B-Instruct

Qwen2.5-1.5B-Instruct

自然语言处理指令微调

多语言支持的轻量级指令型语言模型

llama3_it_ultra_list_and_bold500

llama3_it_ultra_list_and_bold500

自然语言处理Transformers

Transformers库预训练模型概览

xlm-roberta-large

xlm-roberta-large

自然语言处理XLM-RoBERTa

大规模多语言预训练模型

wav2vec2-large-xlsr-53-english

wav2vec2-large-xlsr-53-english

XLSR-53Common Voice

XLSR-53微调的英语语音识别模型

XL-Judge-LLM

XL-Judge-LLM

模型卡片文本生成

多语言法律评判和文本生成的先进模型

awesome-gpt4

awesome-gpt4

GPT-4语言模型

GPT-4资源汇集 提示工具与应用实例

autogen-agi

autogen-agi

AutoGen人工智能

增强型多智能体协作系统探索AGI特性

pubmed-rct

pubmed-rct

PubMed 200k RCT数据集

大规模医学摘要句子分类数据集