精选AI数据集工具和项目大集合

LawBench

LawBench

LawBench大语言模型

通过司法认知多维度评估大模型法律能力

ScreenAgent

ScreenAgent

ScreenAgentVLM Agent

由视觉语言大模型驱动的电脑控制工具

bocoel

bocoel

BoCoEL贝叶斯优化

贝叶斯优化用于评估大型语言模型的开源工具

awesome-recommend-system-pretraining-papers

awesome-recommend-system-pretraining-papers

Recommend System预训练模型

推荐系统预训练及大型语言模型论文资源

alpaca-chinese-dataset

alpaca-chinese-dataset

alpaca中文指令

中文指令微调数据集生成与清洗方法

trainable-agents

trainable-agents

Character-LLM角色扮演

可训练的角色扮演AI,实现动态个性化互动

Voice-Cloning-App

Voice-Cloning-App

Voice Cloning App语音克隆

声音克隆技术应用:从自动合成到多语言支持

CareGPT

CareGPT

CareGPT医疗LLM

医疗人工智能开源模型

DB-GPT-Hub

DB-GPT-Hub

DB-GPT-HubText-to-SQL

通过大型语言模型(LLMs)实现复杂的Text-to-SQL解析

safe-rlhf

safe-rlhf

Beaver安全RLHF

北京大学开发的AI安全增强框架

LLMDataHub

LLMDataHub

LLMDataHub数据集

大语言模型训练数据集合

deep-text-recognition-benchmark

deep-text-recognition-benchmark

场景文本识别深度学习

基于深度学习方法的文本识别

fashion-mnist

fashion-mnist

Fashion-MNIST机器学习

是 Zalando 文章图像的数据集,由 60,000 个样本的训练集和 10,000 个样本的测试集组成

tensor2tensor

tensor2tensor

Tensor2Tensor深度学习

一个旨在使深度学习更加深入的深度学习模型和数据集的库

datasets

datasets

Hugging Face数据集

最大的 ML 模型即用型数据集中心,具有快速、易用且高效的数据操作工具

lunary

lunary

lunaryLLM

开源LLM应用的可观测性、提示管理和评估工具

jailbreak_llms

jailbreak_llms

JailbreakHubACM CCS 2024

大规模语言模型野生越狱提示的特征与评估研究

CV

CV

Pytorch深度学习

深度学习视频教程及笔记资源

ssd.pytorch

ssd.pytorch

SSDPyTorch

PyTorch实现的高效SSD目标检测器,兼容多数据集与实时可视化

fiftyone

fiftyone

FiftyOne数据集

高效的数据集构建与计算机视觉模型工具