精选AI数据集工具和项目大集合

opus-mt-en-gl

opus-mt-en-gl

语言模型模型

英语到加利西亚语机器翻译模型 基于OPUS数据集

LLaMA-1B-dj-refine-150B

LLaMA-1B-dj-refine-150B

模型LLM

LLaMA架构的开源语言模型基于精炼数据集训练

opus-mt-hi-en

opus-mt-hi-en

语言模型机器翻译

基于OPUS数据集的印地语-英语开源机器翻译模型

whisper-tiny-quiztest

whisper-tiny-quiztest

Huggingface模型

微型语音识别模型为Quiz测试场景提供精准解决方案

opus-mt-en-da

opus-mt-en-da

模型机器翻译

基于OPUS数据集的英丹双语机器翻译模型

bert-tiny-finetuned-sms-spam-detection

bert-tiny-finetuned-sms-spam-detection

垃圾短信检测Huggingface

BERT-Tiny模型实现高精度SMS垃圾信息检测

distilbert-base-uncased-CoLA

distilbert-base-uncased-CoLA

Huggingface模型

DistilBERT模型在CoLA任务上的微调与应用

roberta-spam

roberta-spam

模型文本分类

RoBERTa垃圾短信检测系统提升组织安全防护能力

dreamshaper-xl-1-0

dreamshaper-xl-1-0

模型模型卡片

基于Diffusers的AI图像生成模型 支持多样化创意表达

opus-mt-tr-en

opus-mt-tr-en

语言模型机器翻译

基于OPUS数据集的土耳其语英语机器翻译模型

opus-mt-en-id

opus-mt-en-id

模型Github

英语至印尼语开源神经机器翻译模型

ToolACE-8B

ToolACE-8B

模型函数调用

在工具调用性能上与GPT-4旗鼓相当的开源语言模型

Skywork-Reward-Llama-3.1-8B-v0.2

Skywork-Reward-Llama-3.1-8B-v0.2

模型Reward Model

小型数据集训练的高性能奖励模型实现卓越偏好处理

MiniLM-evidence-types

MiniLM-evidence-types

模型模型训练

MiniLM模型在证据类型分类任务上的应用与性能

CrystalClearXL

CrystalClearXL

模型模型卡片

基于扩散模型的AI图像生成与编辑工具

toxigen_roberta

toxigen_roberta

隐式仇恨言论检测机器学习

基于大规模数据集的隐含仇恨言论检测模型

bge-micro-v2

bge-micro-v2

模型Github

轻量高效的语义相似度神经网络

mitsua-diffusion-cc0

mitsua-diffusion-cc0

模型人工智能

Mitsua Diffusion CC0模型探索符合伦理的AI艺术创作新方向

wav2vec2-large-robust-ft-libritts-voxpopuli

wav2vec2-large-robust-ft-libritts-voxpopuli

模型标点符号

精确转录语音的Wav2Vec2模型 支持标点符号输出

LanguageBind_Image

LanguageBind_Image

模型ICLR

基于语言实现多模态预训练绑定