最佳自然语言处理工具集合 - 实用AI工具推荐

自然语言处理

robbert-v2-dutch-base

robbert-v2-dutch-base

模型荷兰语模型

荷兰语自然语言处理的先进预训练模型

Florence-2-base-ft

Florence-2-base-ft

模型Florence-2

多任务视觉AI模型实现图像理解与分析

biogpt

biogpt

模型Github

生物医学领域的预训练生成式语言模型

sew-d-tiny-100k-ft-ls100h

sew-d-tiny-100k-ft-ls100h

模型Github

SEW-D架构语音识别模型实现性能与效率的优化平衡

low-law-emb

low-law-emb

模型Github

高维度句子嵌入模型实现精准语义搜索和文本聚类

Llama-3.1-70B

Llama-3.1-70B

模型Github

Meta Llama 3.1 突破性多语言大模型 支持128K上下文

question-vs-statement-classifier

question-vs-statement-classifier

查询分类Huggingface

神经网络问句陈述句分类器提升搜索准确性

dragon-plus-query-encoder

dragon-plus-query-encoder

模型BERT

DRAGON+ 基于BERT的先进密集检索模型

vram-40

vram-40

模型Transformers

优化Transformer模型的内存和性能实现

pythia-70m

pythia-70m

模型Github

促进语言模型可解释性研究的小型模型

TinyLlama_v1.1

TinyLlama_v1.1

语言模型神经网络

精简版Llama模型 专注多领域应用

CodeLlama-7b-hf

CodeLlama-7b-hf

模型Github

基于7B参数的代码生成与理解模型

Qwen2.5-0.5B

Qwen2.5-0.5B

模型Qwen2.5

轻量级多语言预训练模型 支持长上下文和结构化输出

Mistral-7B-Instruct-v0.3-GPTQ-4bit

Mistral-7B-Instruct-v0.3-GPTQ-4bit

模型Github

Mistral-7B指令模型的4位量化版本 保持高准确率

indonesian-sbert-large

indonesian-sbert-large

模型Github

印尼语句向量模型实现语义搜索和文本聚类

bert-base-arabic-camelbert-mix-ner

bert-base-arabic-camelbert-mix-ner

模型Github

基于CAMeLBERT Mix的阿拉伯语命名实体识别模型

sentence-t5-xl

sentence-t5-xl

模型文本向量化

高维向量映射模型实现句子和段落的精确表示

Qwen2.5-3B

Qwen2.5-3B

Huggingface模型

新一代多语言模型提升代码数学和长文本处理能力

gemma-2b-it

gemma-2b-it

模型大型语言模型

Google开源轻量级语言模型 适用于资源受限环境

pix2struct-tiny-random

pix2struct-tiny-random

计算机视觉Huggingface

高效图像到文本转换的轻量级模型