值得探索的AI开源项目:工具、网站与应用合集

wav2vec2

wav2vec2

Github模型

Wav2Vec2模型在Habana Gaudi处理器上的优化训练配置

rebel-large

rebel-large

序列到序列模型Github

基于BART的端到端关系抽取模型

granite-timeseries-ttm-r2

granite-timeseries-ttm-r2

预训练模型Github

IBM开源轻量级模型TTM引领时间序列预测新方向

Italian_NER_XXL

Italian_NER_XXL

BERT更新

意大利实体识别模型,识别52类实体

whisper-large-v3-ru-podlodka

whisper-large-v3-ru-podlodka

语音识别Github

基于Whisper Large V3的俄语优化语音识别模型

llava-onevision-qwen2-72b-si

llava-onevision-qwen2-72b-si

LLaVA-OneVision图像交互

多模态模型提高视觉数据交互准确率

nli-deberta-v3-large

nli-deberta-v3-large

模型训练Natural Language Inference

高效实现自然语言推断的跨编码器

Phi-3-mini-4k-instruct-bnb-4bit

Phi-3-mini-4k-instruct-bnb-4bit

Github开源项目

通过Unsloth工具提升深度学习模型微调速度与内存效率

granite-3.0-8b-instruct

granite-3.0-8b-instruct

AI助手开源项目

多领域AI助手构建的多语言文本生成模型

bert-fa-base-uncased-sentiment-deepsentipers-binary

bert-fa-base-uncased-sentiment-deepsentipers-binary

开源项目情感分析

波斯语情感分析优化:ParsBERT v2.0项目

distil-small.en

distil-small.en

语音识别Github

轻量快速的英语语音识别模型,保持高准确率

e5-small-unsupervised

e5-small-unsupervised

无监督学习文本嵌入

无监督预训练模型用于提升文本嵌入与句子相似度

gpt_bigcode-santacoder

gpt_bigcode-santacoder

Github模型

多语言代码生成模型SantaCoder支持Python、Java和JavaScript

queratogray-sketch

queratogray-sketch

Github开源项目

基于Stable Diffusion的素描风格AI模型

rotten_tomatoes_t5-base_seed-1

rotten_tomatoes_t5-base_seed-1

环境影响Huggingface

变形金刚模型卡功能与应用指南

ko-sroberta-nli

ko-sroberta-nli

ko-sroberta-nli句子相似度

韩语句子语义嵌入的开源模型

cde-small-v1

cde-small-v1

MTEB分类

增强文本分类与信息检索能力的多任务模型

fuyu-8b

fuyu-8b

Github模型

无需图像编码器的轻量级多模态开源模型

bert-for-patents

bert-for-patents

BERTGithub

Google基于亿级专利数据训练的大规模语言模型

open-calm-3b

open-calm-3b

日本语开源项目

基于日语数据集的解码器语言模型