easyportrait

easyportrait

人像分割和面部解析大规模数据集

EasyPortrait是一个包含40,000张高质量标注RGB图像的数据集,用于人像分割和面部解析研究。数据集提供9个类别的标注,涵盖背景、人物、皮肤、眉毛、眼睛等。它可应用于视频会议背景移除、面部美化等多个场景。数据集基于用户ID划分训练、验证和测试集,并提供多个基线模型的预训练权重,为计算机视觉研究提供了有价值的资源。

EasyPortrait人像分割数据集面部解析人工智能Github开源项目

easyportrait

EasyPortrait - 面部解析和人像分割数据集

我们推出了一个大规模图像数据集EasyPortrait,用于人像分割和面部解析。该数据集可用于多项任务,如会议应用中的背景去除、牙齿美白、面部皮肤增强、红眼去除或眼睛着色等。

EasyPortrait数据集大小约为91.78GB,包含40,000张RGB图像(约38.3K全高清图像),带有高质量的标注掩码。该数据集按照user_id主题分为训练集、验证集和测试集。训练集包含30,000张图像,验证集包含4,000张图像,测试集包含6,000张图像。

更多信息请参阅我们的论文EasyPortrait – 面部解析和人像分割数据集

🔥 更新日志

  • 2023/11/13: 我们发布了EasyPortrait 2.0版本。✌️
    • 40,000张RGB图像(约38.3K全高清图像)
    • 增加了地区、种族、人类情绪和光照条件的多样性
    • 数据进行了进一步清理并添加了新内容
    • 训练/验证/测试集划分:(30,000)75% /(4,000)10% /(6,000)15%,按照user_id主题划分
    • 多GPU训练和测试
    • 为面部解析和人像分割添加了新模型
    • 数据集大小为91.78GB
    • 13,705个独特个体
  • 2023/02/23: EasyPortrait(初始数据集)💪
    • 数据集大小为26GB
    • 20,000张RGB图像(约17.5K全高清图像),标注了9个类别
    • 训练/验证/测试集划分:(14,000)70% /(2,000)10% /(4,000)20%,按照user_id主题划分
    • 8,377个独特个体

旧版EasyPortrait数据集也可在EasyPortrait_v1分支中获取!

下载

链接大小
images91.8 GB
annotations657.1 MB
meta1.9 MB
训练集68.3 GB
验证集10.7 GB
测试集12.8 GB

此外,您还可以从Kaggle下载EasyPortrait数据集。

结构

.
├── images.zip
│   ├── train/         # 训练集:30k
│   ├── val/           # 验证集:4k
│   ├── test/          # 测试集:6k
├── annotations.zip
│   ├── train/
│   ├── val/
│   ├── test/
├── meta.zip       # 元信息(宽度、高度、亮度、imhash、user_id)
...

模型

我们提供了一些预训练模型作为人像分割和面部解析的基准。我们使用平均交并比(mIoU)作为主要评估指标。

人像分割:

模型名称参数量(百万)输入尺寸平均交并比
BiSeNet-V256.5384 x 38497.95
DANet190.2384 x 38498.63
DeepLabv3260384 x 38498.63
ExtremeC3Net0.15384 x 38496.54
Fast SCNN6.13384 x 38497.64
FCN + MobileNetv231.17384 x 38498.19
FPN + ResNet50108.911024 × 102498.54
FPN + ResNet50108.91512 × 51298.64
FPN + ResNet50108.91384 x 38498.64
FPN + ResNet50108.91224 × 22498.31
SegFormer-B014.91024 × 102498.74
SegFormer-B014.9512 × 51298.66
SegFormer-B014.9384 x 38498.61
SegFormer-B014.9224 × 22498.17
SINet0.13384 x 38493.32

人脸解析:

模型名称参数量 (百万)输入尺寸平均交并比
BiSeNet-V256.5384 x 38476.72
DANet190.2384 x 38479.3
DeepLabv3260384 x 38479.11
EHANet44.81384 x 38472.56
Fast SCNN6.13384 x 38467.56
FCN + MobileNetv231.17384 x 38475.23
FPN + ResNet50108.911024 × 102485.37
FPN + ResNet50108.91512 × 51283.33
FPN + ResNet50108.91384 x 38481.83
FPN + ResNet50108.91224 × 22475.6
SegFormer-B014.91024 × 102485.42
SegFormer-B014.9512 × 51283.19
SegFormer-B014.9384 x 38481.38
SegFormer-B014.9224 × 22474.83

标注

标注以2D数组的形式呈现,图像以 *.png 格式存储,包含多个类别:

索引类别
0背景
1人物
2皮肤
3左眉
4右眉
5左眼
6右眼
7嘴唇
8牙齿

此外,我们在 annotations/meta.zip 文件中提供了一些额外的数据集元信息:

图像名称用户ID高度宽度集合亮度
0a753e021-...56...720960训练集126
14ff04492-...ba...19201440测试集173
2e8934c99-...1d...19201440验证集187

其中:

  • image_name - 不带扩展名的图像文件名
  • user_id - 唯一的匿名用户ID
  • height - 图像高度
  • width - 图像宽度
  • brightness - 图像亮度
  • set - "train"、"test" 或 "val" 分别表示训练集、测试集或验证集

图像

easyportrait

在EasyPortrait上进行训练、评估和测试

代码基于 MMSegmentation 0.30.0版本。

模型在8个NVIDIA V100 GPU上使用CUDA 11.2进行训练和评估。

安装过程请按照这里的说明进行,并使用我们仓库中的 requirements.txt 文件。

<details> <summary>训练</summary>

单GPU模式:

python ./pipelines/tools/train.py ./pipelines/local_configs/easy_portrait_experiments/<model_dir>/<config_file>.py --gpu-id <GPU_ID>

分布式训练模式:

./pipelines/tools/dist_train.sh ./pipelines/local_configs/easy_portrait_experiments/<model_dir>/<config_file>.py <NUM_GPUS>
</details> <details> <summary>评估</summary>

单GPU模式:

python ./pipelines/tools/test.py <PATH_TO_MODEL_CONFIG> <PATH_TO_CHECKPOINT> --gpu-id <GPU_ID> --eval mIoU

分布式评估模式:

./pipelines/tools/dist_test.sh <PATH_TO_MODEL_CONFIG> <PATH_TO_CHECKPOINT> <NUM_GPUS> --eval mIoU
</details> <details> <summary>运行演示</summary> ```console python ./pipelines/demo/image_demo.py <图片路径> <模型配置路径> <检查点路径> --palette=easy_portrait --out-file=<输出文件路径> ``` </details>

作者与贡献者

相关链接

引用

您可以使用以下BibTeX条目引用本论文:

@article{EasyPortrait,
    title={EasyPortrait - Face Parsing and Portrait Segmentation Dataset},
    author={Kapitanov, Alexander and Kvanchiani, Karina and Kirillova Sofia},
    journal={arXiv preprint arXiv:2304.13509},
    year={2023}
}

许可证

<a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/"><img alt="知识共享许可协议" style="border-width:0" src="https://yellow-cdn.veclightyear.com/0a4dffa0/0ba9e5ef-5434-4c2c-a827-bf313e9940c7.png" /></a><br />本作品采用<a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/">知识共享署名-相同方式共享 4.0 国际许可协议</a>的一个变种进行许可。

请查看具体的许可证

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具使用教程AI营销产品酷表ChatExcelAI智能客服
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

数据安全AI助手热门AI工具AI辅助写作AI论文工具论文写作智能生成大纲
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

热门AI工具AI办公办公工具智能排版AI生成PPT博思AIPPT海量精品模板AI创作
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多