最佳Github AI工具与开源项目集锦

mimi

mimi

模型语音处理

先进神经音频编解码器实现高效语音处理

wav2vec2-large-xlsr-korean

wav2vec2-large-xlsr-korean

模型Wav2Vec2

基于wav2vec2的韩语语音识别模型实现高精度自动转写

faster-whisper-large-v3

faster-whisper-large-v3

WhisperHuggingface

多语言语音识别模型CTranslate2版Whisper large-v3

dragon-multiturn-query-encoder

dragon-multiturn-query-encoder

多轮对话模型

优化多轮对话检索的强大查询编码器

t5-v1_1-xxl

t5-v1_1-xxl

Huggingface模型

Google T5模型的改进版本 提升多种NLP任务性能

RMBG-1.4

RMBG-1.4

Huggingface背景去除

高效精准的AI背景移除模型

indonesian-roberta-base-posp-tagger

indonesian-roberta-base-posp-tagger

印尼语RoBERTa

基于RoBERTa的印尼语词性标注模型

faster-whisper-large-v2

faster-whisper-large-v2

WhisperHuggingface

基于Whisper large-v2的高效多语言语音转文本模型

splade-cocondenser-selfdistil

splade-cocondenser-selfdistil

知识蒸馏稀疏模型

SPLADE模型在段落检索任务中的优化应用

gliner_medium_news-v2.1

gliner_medium_news-v2.1

模型人工智能

GLiNER新闻实体抽取模型提升多语言长文本准确率

contriever

contriever

无监督学习模型

高效无监督密集信息检索的对比学习模型

Llama-3.1-405B-Instruct

Llama-3.1-405B-Instruct

模型LLaMA 3.1

Meta开发的多语言大规模语言模型 支持商业和研究应用

mxbai-embed-large-v1

mxbai-embed-large-v1

模型检索

多语言NLP嵌入模型在MTEB基准测试中展现卓越性能

Phi-3.5-mini-instruct

Phi-3.5-mini-instruct

模型长文本理解

轻量级多语言长文本AI模型

quote-model-BERTm-v1

quote-model-BERTm-v1

模型BERT

BERT多语言模型在引用识别任务上的高性能微调应用

whisper-large-v3-turbo

whisper-large-v3-turbo

AI模型Whisper

OpenAI Whisper large-v3-turbo 快速多语言语音识别与翻译模型

roberta-hate-speech-dynabench-r4-target

roberta-hate-speech-dynabench-r4-target

动态生成数据集开源项目

动态数据集驱动的在线仇恨检测模型

opus-mt-es-en

opus-mt-es-en

模型西班牙语

西班牙语至英语机器翻译模型 Tatoeba测试集BLEU评分59.6

distiluse-base-multilingual-cased-v2

distiluse-base-multilingual-cased-v2

模型Github

多语言句子向量模型 适用于60多种语言的语义分析

opensearch-neural-sparse-encoding-doc-v2-distill

opensearch-neural-sparse-encoding-doc-v2-distill

模型OpenSearch

神经稀疏编码模型优化文档检索效率