精选AI数据集工具和项目大集合

scenario-teacher-data-hate_speech_filipino-model-xlm-roberta-base

scenario-teacher-data-hate_speech_filipino-model-xlm-roberta-base

开源项目准确率

优化后的模型用于菲律宾语的仇恨言论检测

TinyStories-33M

TinyStories-33M

模型训练开源项目

基于GPT-Neo架构的开源文本生成模型

Llama-3-8b-rm-mixture

Llama-3-8b-rm-mixture

OpenRLHFLlama3-8b

基于Llama3-8b的奖励模型训练与优化

japanese-sentiment-analysis

japanese-sentiment-analysis

高精度模型训练

基于chABSA数据集的日语情感分析模型,具有高准确率和F1分数

Llama-3.2-3B-Instruct-uncensored-GGUF

Llama-3.2-3B-Instruct-uncensored-GGUF

数据集开源项目

多硬件兼容的Llama-3.2量化模型

toutiao

toutiao

数据集Github

中文新闻分类模型,便捷文本分析工具

timely-arctic-small

timely-arctic-small

Snowflake/snowflake-arctic-embed-sHuggingface

语义相似度分析模型:句子向量化工具

e5-small

e5-small

数据集开源项目

高效轻量的句子相似度计算模型

opus-mt-hu-en

opus-mt-hu-en

BLEU评分开源项目

基于OPUS数据集的匈牙利语-英语机器翻译模型

LiteLlama-460M-1T

LiteLlama-460M-1T

数据集机器学习

轻量级高性能语言模型精简参数实现大模型能力

opus-mt-en-et

opus-mt-en-et

opus-mt模型评估

英语至爱沙尼亚语神经机器翻译模型

opus-mt-en-he

opus-mt-en-he

开源项目机器翻译

基于OPUS数据集的英语-希伯来语机器翻译模型

opus-mt-fr-de

opus-mt-fr-de

opus-mt-fr-de机器翻译

transformer-align架构的法德翻译模型,适用于新闻政治等多领域

snowflake-arctic-embed-s

snowflake-arctic-embed-s

Huggingface开源项目

开源语义搜索模型实现文本匹配分类与相似度分析

bertweet-base-emotion-analysis

bertweet-base-emotion-analysis

机器学习Github

BerTweet英文情感分析模型集成EmoEvent语料库

DeBERTa-v3-FaithAug

DeBERTa-v3-FaithAug

自然语言推理知识对话

基于DeBERTa的知识对话系统可靠性评估模型

whisper-tiny.en

whisper-tiny.en

GithubWhisper

Whisper微调的英文语音识别模型

monot5-large-msmarco

monot5-large-msmarco

GithubHuggingface

MSMarco文本重排序优化版T5-large模型

resnet-tiny-beans

resnet-tiny-beans

测试Github

基于ResNet的轻量级豆类识别模型

SFR-Embedding-Mistral

SFR-Embedding-Mistral

性能指标模型评估

基于Mistral的开源多语言文本嵌入模型