精选AI数据集工具和项目大集合

transformers-ud-japanese-electra-base-ginza-510

transformers-ud-japanese-electra-base-ginza-510

数据集句法结构

基于ELECTRA的日语自然语言处理模型

UnslopNemo-12B-v2-GGUF

UnslopNemo-12B-v2-GGUF

数据集开源项目

增强AI模型表达能力的实验探索

Barcenas-14b-Phi-3-medium-ORPO

Barcenas-14b-Phi-3-medium-ORPO

VAGOsolutions对话能力

模型通过ORPO方法提升对话能力

parakeet-tdt_ctc-1.1b

parakeet-tdt_ctc-1.1b

词错误率自动语音识别

高性能自动语音识别模型解决方案

mHuBERT-147

mHuBERT-147

数据集开源项目

支持147种语言的紧凑型多语言HuBERT模型

Fugaku-LLM-13B-instruct-gguf

Fugaku-LLM-13B-instruct-gguf

数据集使用条款

Fugaku-LLM日本语言模型的高效转换和应用

Lumimaid-v0.2-12B-GGUF-IQ-Imatrix

Lumimaid-v0.2-12B-GGUF-IQ-Imatrix

Lumimaid量化过程

高效量化与SillyTavern兼容的Lumimaid角色扮演模型

olm-roberta-base-dec-2022

olm-roberta-base-dec-2022

Huggingface开源项目

OLM项目的更新模型,增强了语言任务表现

Mistral-Nemo-12B-ArliAI-RPMax-v1.1-GGUF

Mistral-Nemo-12B-ArliAI-RPMax-v1.1-GGUF

ArliAI-RPMax-12B-v1.1训练

基于Mistral Nemo 12B的创新多样性写作模型

flair-ner-spanish-judicial

flair-ner-spanish-judicial

数据集Github

增强拉美司法系统中性别暴力案件的透明度和数据收集效率

blip-itm-base-flickr

blip-itm-base-flickr

数据集生成任务

用于视觉语言理解和生成的多功能开源工具

SmolLM-1.7B-Instruct

SmolLM-1.7B-Instruct

数据集Github

SmolLM-1.7B-Instruct 模型的技术特性与应用场景分析

suzume-llama-3-8B-multilingual-orpo-borda-half

suzume-llama-3-8B-multilingual-orpo-borda-half

评估结果数据集

多语言性能优化,基于lightblue模型的ORPO改进

OPT-6.7B-Erebus

OPT-6.7B-Erebus

数据集生成文本

了解OPT-6.7B-Erebus模型及其成人内容生成特点

opus-mt-de-it

opus-mt-de-it

数据集开源项目

德语到意大利语的开源翻译模型

txlm-roberta-hindi-sentiment

txlm-roberta-hindi-sentiment

数据集F1-score

印地语情感分析模型:性能与应用场景

gpt-ya2-v2

gpt-ya2-v2

Huggingfacegpt2

基于kpriyanshu256数据集优化的文本生成模型

opus-mt-sq-en

opus-mt-sq-en

数据集Github

中立且精准的阿尔巴尼亚语到英语翻译工具

dolly-v2-12b

dolly-v2-12b

指令调优dolly-v2-12b

Databricks开源商用语言模型

Truthful_DPO_TomGrc_FusionNet_7Bx2_MoE_13B

Truthful_DPO_TomGrc_FusionNet_7Bx2_MoE_13B

偏好数据Huggingface

利用DPO优化方法提升语言模型的性能