聚类AI工具大集合 - 实用应用与开源项目汇总

hubert-xlarge-ls960-ft

hubert-xlarge-ls960-ft

Hubert开源项目

采用大规模LibriSpeech数据集微调的HuBERT模型,展示前沿语音识别性能

Linq-Embed-Mistral

Linq-Embed-Mistral

重排聚类

多任务文本分析工具

mmlw-roberta-large

mmlw-roberta-large

文本分类开源项目

增强自然语言处理适用性的多任务学习模型

cde-small-v1

cde-small-v1

MTEB分类

增强文本分类与信息检索能力的多任务模型

NV-Embed-v2

NV-Embed-v2

检索模型

多语言嵌入模型提升各类自然语言处理任务性能

snowflake-arctic-embed-xs

snowflake-arctic-embed-xs

模型检索

轻量级多语言句子嵌入模型,专注文本相似度分析

stella_en_1.5B_v5

stella_en_1.5B_v5

Huggingface模型

先进的英语语义相似度和文本分类模型

snowflake-arctic-embed-m

snowflake-arctic-embed-m

模型检索

多语言句子嵌入模型助力相似度计算和语义搜索

text2vec-base-multilingual

text2vec-base-multilingual

模型多语言

多语言文本嵌入与分类模型

NV-Embed-v1

NV-Embed-v1

检索模型

多任务自然语言处理领域的高性能嵌入式模型

bge-small-en

bge-small-en

Huggingface模型

英文文本嵌入模型在多种自然语言处理任务中展现出色性能

mxbai-embed-large-v1

mxbai-embed-large-v1

模型检索

多语言NLP嵌入模型在MTEB基准测试中展现卓越性能

multilingual-e5-small

multilingual-e5-small

检索模型

多语言句子嵌入模型支持100多种语言

gte-large-en-v1.5

gte-large-en-v1.5

Huggingface情感分析

英语语义相似度模型用于文本分类和检索

bge-small-en-v1.5

bge-small-en-v1.5

语义相似度文本分类

轻量级高性能英语句子嵌入模型

ml_hacks

ml_hacks

机器学习算法

机器学习实践与教程资源集锦

TEXTOIR

TEXTOIR

TEXTOIR意图识别

开放式意图识别的综合工具包

100DaysofMLCode

100DaysofMLCode

机器学习数据预处理

100天掌握机器学习编程实践从数据预处理到深度学习

dtaidistance

dtaidistance

时间序列动态时间规整

快速时间序列距离计算库

cbtm

cbtm

c-BTM语言模型

无监督领域发现技术扩展专家语言模型