精选AI数据集工具和项目大集合

transformers-ud-japanese-electra-base-ginza-510

transformers-ud-japanese-electra-base-ginza-510

GithubELECTRA

基于ELECTRA的日语自然语言处理模型

UnslopNemo-12B-v2-GGUF

UnslopNemo-12B-v2-GGUF

GithubUnslopNemo

增强AI模型表达能力的实验探索

Barcenas-14b-Phi-3-medium-ORPO

Barcenas-14b-Phi-3-medium-ORPO

Barcenas-14b-Phi-3-medium-ORPO开源项目

模型通过ORPO方法提升对话能力

parakeet-tdt_ctc-1.1b

parakeet-tdt_ctc-1.1b

快速同构体Github

高性能自动语音识别模型解决方案

mHuBERT-147

mHuBERT-147

数据集开源项目

支持147种语言的紧凑型多语言HuBERT模型

Fugaku-LLM-13B-instruct-gguf

Fugaku-LLM-13B-instruct-gguf

Github开源项目

Fugaku-LLM日本语言模型的高效转换和应用

Lumimaid-v0.2-12B-GGUF-IQ-Imatrix

Lumimaid-v0.2-12B-GGUF-IQ-Imatrix

量化过程Github

高效量化与SillyTavern兼容的Lumimaid角色扮演模型

olm-roberta-base-dec-2022

olm-roberta-base-dec-2022

OLM RoBERTaGithub

OLM项目的更新模型,增强了语言任务表现

Mistral-Nemo-12B-ArliAI-RPMax-v1.1-GGUF

Mistral-Nemo-12B-ArliAI-RPMax-v1.1-GGUF

HuggingfaceGithub

基于Mistral Nemo 12B的创新多样性写作模型

flair-ner-spanish-judicial

flair-ner-spanish-judicial

Github法律裁决

增强拉美司法系统中性别暴力案件的透明度和数据收集效率

blip-itm-base-flickr

blip-itm-base-flickr

Github生成任务

用于视觉语言理解和生成的多功能开源工具

SmolLM-1.7B-Instruct

SmolLM-1.7B-Instruct

SmolLM开源项目

SmolLM-1.7B-Instruct 模型的技术特性与应用场景分析

suzume-llama-3-8B-multilingual-orpo-borda-half

suzume-llama-3-8B-multilingual-orpo-borda-half

Suzume ORPOGithub

多语言性能优化,基于lightblue模型的ORPO改进

OPT-6.7B-Erebus

OPT-6.7B-Erebus

OPT 6.7B - ErebusGithub

了解OPT-6.7B-Erebus模型及其成人内容生成特点

opus-mt-de-it

opus-mt-de-it

opus-mt-de-it开源项目

德语到意大利语的开源翻译模型

txlm-roberta-hindi-sentiment

txlm-roberta-hindi-sentiment

HuggingfaceGithub

印地语情感分析模型:性能与应用场景

gpt-ya2-v2

gpt-ya2-v2

gpt2Github

基于kpriyanshu256数据集优化的文本生成模型

opus-mt-sq-en

opus-mt-sq-en

数据集Github

中立且精准的阿尔巴尼亚语到英语翻译工具

dolly-v2-12b

dolly-v2-12b

开源项目Github

Databricks开源商用语言模型

Truthful_DPO_TomGrc_FusionNet_7Bx2_MoE_13B

Truthful_DPO_TomGrc_FusionNet_7Bx2_MoE_13B

语言模型TomGrc/FusionNet_7Bx2_MoE_14B

利用DPO优化方法提升语言模型的性能