最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

Kolors-diffusers

Kolors-diffusers

KolorsHuggingface

基于扩散模型的高质量文本到图像生成技术

gte-Qwen2-1.5B-instruct

gte-Qwen2-1.5B-instruct

模型Github

先进语言模型在MTEB多任务评估中的优异成绩

indonesian-roberta-base-sentiment-classifier

indonesian-roberta-base-sentiment-classifier

模型情感分析

印尼语RoBERTa情感分类器:高精度的开源NLP工具

Llama-3.2-1B-Instruct-GGUF

Llama-3.2-1B-Instruct-GGUF

模型模型训练

Llama 3.2语言模型微调加速与优化工具

specter2_aug2023refresh_base

specter2_aug2023refresh_base

模型SPECTER2

基于引用关系的科学文献嵌入模型

falcon-40b

falcon-40b

语言模型Huggingface

性能领先的开源大规模语言模型

tapas-large-finetuned-wtq

tapas-large-finetuned-wtq

Huggingface模型

TAPAS大型表格问答模型实现精准查询和复杂推理

upos-english

upos-english

模型Github

Flair框架英语词性标注模型 实现98.6% F1分数

TinyLLama-v0

TinyLLama-v0

模型模型训练

基于Llama架构的轻量级开源文本生成模型TinyLLama

bge-small-en-v1.5-onnx-Q

bge-small-en-v1.5-onnx-Q

模型Github

BGE小型英文模型的量化ONNX版本用于文本分类和相似度搜索

open_llama_3b

open_llama_3b

模型Github

开源复现LLaMA架构的大型语言模型

llama-3-typhoon-v1.5-8b-instruct

llama-3-typhoon-v1.5-8b-instruct

模型泰语大语言模型

Llama3架构的80亿参数泰语大模型 支持泰英双语指令

unixcoder-base

unixcoder-base

Huggingface模型

微软开发的跨模态代码表示预训练模型

DeepSeek-Coder-V2-Lite-Instruct

DeepSeek-Coder-V2-Lite-Instruct

模型DeepSeek-Coder-V2

开源代码模型支持338种编程语言

flan-t5-xl

flan-t5-xl

模型多语言

基于指令微调的多语言NLP模型

kosmos-2-patch14-224

kosmos-2-patch14-224

Huggingface模型

Kosmos-2模型实现视觉语言融合的理解与生成

flan-ul2

flan-ul2

模型预训练

多语言encoder-decoder模型 适用于翻译问答和逻辑推理

falcon-7b-instruct

falcon-7b-instruct

Huggingface模型

高性能指令微调语言模型

dev-author-em-clf

dev-author-em-clf

模型模型微调

DeBERTa-v3微调的开发者身份识别模型

gpt2-xl

gpt2-xl

Huggingface模型

OpenAI开发的15亿参数GPT-2 XL语言模型