精选AI数据集工具和项目大集合

Qwen2.5-7B-Instruct-Uncensored-GGUF

Qwen2.5-7B-Instruct-Uncensored-GGUF

数据集Github

中英文无删减指令模型的最新静态量化版本,适合多语言支持

bagel-8b-v1.0

bagel-8b-v1.0

AI助手上下文服从

通过多数据集精调优化大型语言模型

nbailab-base-ner-scandi

nbailab-base-ner-scandi

数据集Github

斯堪的纳维亚语言的命名实体识别模型

llm-jp-3-13b-instruct

llm-jp-3-13b-instruct

数据集Github

提供多语言大规模模型,支持多编程环境

dolphin-2.1-mistral-7b

dolphin-2.1-mistral-7b

a16zHuggingface

无审查AI助手模型,商用与非商用都可行

Humanish-LLama3-8B-Instruct-GGUF

Humanish-LLama3-8B-Instruct-GGUF

数据集Github

介绍模型的量化技术实现文本生成性能突破

voxlingua107-epaca-tdnn

voxlingua107-epaca-tdnn

数据集语言识别

全新多语言识别模型,覆盖107种语言,实现精确分类

Llama-3.1-Swallow-70B-Instruct-v0.1

Llama-3.1-Swallow-70B-Instruct-v0.1

日本语言能力开源项目

强化日语和英语能力的多语言大型模型

mistral-7b-instruct-v0.2-bnb-4bit

mistral-7b-instruct-v0.2-bnb-4bit

Mistral性能优化

使用Unsloth技术优化模型微调,显著提升性能并减少内存占用

ALMA-13B-R

ALMA-13B-R

ALMA-R对比偏好优化

通过对比优化提升ALMA-13B-R翻译准确性

OPT-2.7B-Erebus

OPT-2.7B-Erebus

AI模型KoboldAI

专为绘制成人主题的高性能文本生成工具,涵盖多元数据集

granite-3.0-8b-instruct-GGUF

granite-3.0-8b-instruct-GGUF

huggingface量化

文本生成模型的量化优化与性能提升

suzume-llama-3-8B-multilingual-orpo-borda-top75

suzume-llama-3-8B-multilingual-orpo-borda-top75

Suzume ORPO数据集

多语言模型的ORPO方法微调及性能评估

sapbert-from-pubmedbert-squad2

sapbert-from-pubmedbert-squad2

数据集Github

针对问答系统的超参数微调提升模型性能

opus-mt-de-nl

opus-mt-de-nl

数据集transformer-align

德语到荷兰语的机器翻译模型

bloomz-3b

bloomz-3b

数据集Github

项目展现了多语言文本生成和自然语言理解的先进技术

opus-mt-yo-en

opus-mt-yo-en

翻译开源项目

约鲁巴语和英语之间的开源翻译模型及其评估

OPT-13B-Erebus

OPT-13B-Erebus

数据集开源项目

OPT-13B-Erebus模型功能与应用概述

DanTagGen-alpha

DanTagGen-alpha

数据集开源项目

高效艺术标签生成工具,支持多种模型格式

CLIP-ViT-B-16-DataComp.XL-s13B-b90K

CLIP-ViT-B-16-DataComp.XL-s13B-b90K

训练数据数据集

多模态模型CLIP ViT-B/16的零样本图像分类解析