
我们推出了一个大规模图像数据集EasyPortrait,用于人像分割和面部解析。该数据集可用于多项任务,如会议应用中的背景去除、牙齿美白、面部皮肤增强、红眼去除或眼睛着色等。
EasyPortrait数据集大小约为91.78GB,包含40,000张RGB图像(约38.3K全高清图像),带有高质量的标注掩码。该数据集按照user_id主题分为训练集、验证集和测试集。训练集包含30,000张图像,验证集包含4,000张图像,测试集包含6,000张图像。
更多信息请参阅我们的论文EasyPortrait – 面部解析和人像分割数据集。
2023/11/13: 我们发布了EasyPortrait 2.0版本。✌️
user_id主题划分2023/02/23: EasyPortrait(初始数据集)💪
user_id主题划分旧版EasyPortrait数据集也可在EasyPortrait_v1分支中获取!
| 链接 | 大小 |
|---|---|
images | 91.8 GB |
annotations | 657.1 MB |
meta | 1.9 MB |
训练集 | 68.3 GB |
验证集 | 10.7 GB |
测试集 | 12.8 GB |
此外,您还可以从Kaggle下载EasyPortrait数据集。
.
├── images.zip
│ ├── train/ # 训练集:30k
│ ├── val/ # 验证集:4k
│ ├── test/ # 测试集:6k
├── annotations.zip
│ ├── train/
│ ├── val/
│ ├── test/
├── meta.zip # 元信息(宽度、高度、亮度、imhash、user_id)
...
我们提供了一些预训练模型作为人像分割和面部解析的基准。我们使用平均交并比(mIoU)作为主要评估指标。
| 模型名称 | 参数量(百万) | 输入尺寸 | 平均交并比 |
|---|---|---|---|
| BiSeNet-V2 | 56.5 | 384 x 384 | 97.95 |
| DANet | 190.2 | 384 x 384 | 98.63 |
| DeepLabv3 | 260 | 384 x 384 | 98.63 |
| ExtremeC3Net | 0.15 | 384 x 384 | 96.54 |
| Fast SCNN | 6.13 | 384 x 384 | 97.64 |
| FCN + MobileNetv2 | 31.17 | 384 x 384 | 98.19 |
| FPN + ResNet50 | 108.91 | 1024 × 1024 | 98.54 |
| FPN + ResNet50 | 108.91 | 512 × 512 | 98.64 |
| FPN + ResNet50 | 108.91 | 384 x 384 | 98.64 |
| FPN + ResNet50 | 108.91 | 224 × 224 | 98.31 |
| SegFormer-B0 | 14.9 | 1024 × 1024 | 98.74 |
| SegFormer-B0 | 14.9 | 512 × 512 | 98.66 |
| SegFormer-B0 | 14.9 | 384 x 384 | 98.61 |
| SegFormer-B0 | 14.9 | 224 × 224 | 98.17 |
| SINet | 0.13 | 384 x 384 | 93.32 |
| 模型名称 | 参数量 (百万) | 输入尺寸 | 平均交并比 |
|---|---|---|---|
| BiSeNet-V2 | 56.5 | 384 x 384 | 76.72 |
| DANet | 190.2 | 384 x 384 | 79.3 |
| DeepLabv3 | 260 | 384 x 384 | 79.11 |
| EHANet | 44.81 | 384 x 384 | 72.56 |
| Fast SCNN | 6.13 | 384 x 384 | 67.56 |
| FCN + MobileNetv2 | 31.17 | 384 x 384 | 75.23 |
| FPN + ResNet50 | 108.91 | 1024 × 1024 | 85.37 |
| FPN + ResNet50 | 108.91 | 512 × 512 | 83.33 |
| FPN + ResNet50 | 108.91 | 384 x 384 | 81.83 |
| FPN + ResNet50 | 108.91 | 224 × 224 | 75.6 |
| SegFormer-B0 | 14.9 | 1024 × 1024 | 85.42 |
| SegFormer-B0 | 14.9 | 512 × 512 | 83.19 |
| SegFormer-B0 | 14.9 | 384 x 384 | 81.38 |
| SegFormer-B0 | 14.9 | 224 × 224 | 74.83 |
标注以2D数组 的形式呈现,图像以 *.png 格式存储,包含多个类别:
| 索引 | 类别 |
|---|---|
| 0 | 背景 |
| 1 | 人物 |
| 2 | 皮肤 |
| 3 | 左眉 |
| 4 | 右眉 |
| 5 | 左眼 |
| 6 | 右眼 |
| 7 | 嘴唇 |
| 8 | 牙齿 |
此外,我们在 annotations/meta.zip 文件中提供了一些额外的数据集元信息:
| 图像名称 | 用户ID | 高度 | 宽度 | 集合 | 亮度 | |
|---|---|---|---|---|---|---|
| 0 | a753e021-... | 56... | 720 | 960 | 训练集 | 126 |
| 1 | 4ff04492-... | ba... | 1920 | 1440 | 测试集 | 173 |
| 2 | e8934c99-... | 1d... | 1920 | 1440 | 验证集 | 187 |
其中:
image_name - 不带扩展名的图像文件名user_id - 唯一的匿名用户IDheight - 图像高度width - 图像宽度brightness - 图像亮度set - "train"、"test" 或 "val" 分别表示训练集、测试集或验证集
代码基于 MMSegmentation 0.30.0版本。
模型在8个NVIDIA V100 GPU上使用CUDA 11.2进行训练和评估。
安装过程请按照这里的说明进行,并使用我们仓库中的 requirements.txt 文件。
<details> <summary>训练</summary>单GPU模式:
python ./pipelines/tools/train.py ./pipelines/local_configs/easy_portrait_experiments/<model_dir>/<config_file>.py --gpu-id <GPU_ID>
分布式训练模式:
</details> <details> <summary>评估</summary>./pipelines/tools/dist_train.sh ./pipelines/local_configs/easy_portrait_experiments/<model_dir>/<config_file>.py <NUM_GPUS>
单GPU模式:
python ./pipelines/tools/test.py <PATH_TO_MODEL_CONFIG> <PATH_TO_CHECKPOINT> --gpu-id <GPU_ID> --eval mIoU
分布式评估模式:
</details> <details> <summary>运行演示</summary> ```console python ./pipelines/demo/image_demo.py <图片路径> <模型配置路径> <检查点路径> --palette=easy_portrait --out-file=<输出文件路径> ``` </details>./pipelines/tools/dist_test.sh <PATH_TO_MODEL_CONFIG> <PATH_TO_CHECKPOINT> <NUM_GPUS> --eval mIoU
您可以使用以下BibTeX条目引用本论文:
@article{EasyPortrait,
title={EasyPortrait - Face Parsing and Portrait Segmentation Dataset},
author={Kapitanov, Alexander and Kvanchiani, Karina and Kirillova Sofia},
journal={arXiv preprint arXiv:2304.13509},
year={2023}
}
<a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/"><img alt="知识共享许可协议" style="border-width:0" src="https://yellow-cdn.veclightyear.com/0a4dffa0/0ba9e5ef-5434-4c2c-a827-bf313e9940c7.png" /></a><br />本作品采用<a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/">知识共享署名-相同方式共享 4.0 国际许可协议</a>的一个变 种进行许可。
请查看具体的许可证。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。


企业专属的AI法律顾问
iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。


稳定高效的流量提升解决方案,助力品牌曝光
稳定高效的流量提升解决方案,助力品牌曝光


最新版Sora2模型免费使用,一键生成无水印视频
最新版Sora2模型免费使用,一键生成无水印视频
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号