本文提出了DiffusionMat,这是一种新颖的图像抠图框架,它采用扩散模型来实现从粗糙到精细的alpha遮罩转换。与传统方法不同,传统方法仅将三元图作为alpha遮罩预测的松散指导,我们的方法将图像抠图视为一个序列细化学习过程。该过程首先向三元图添加噪声,然后使用预训练的扩散模型迭代地对其进行去噪,逐步引导预测趋向于干净的alpha遮罩。我们框架的关键创新在于一个校正模块,它在每个去噪步骤中调整输出,确保最终结果与输入图像的结构一致。我们还引入了Alpha可靠性传播,这是一种新技术,旨在通过选择性地增强具有可靠alpha信息的三元图区域来最大化可用指导的效用,从而简化校正任务。为了训练校正模块,我们设计了专门的损失函数,以提高alpha遮罩边缘的准确性和不透明及透明区域的一致性。我们在多个图像抠图基准测试中评估了我们的模型,结果表明DiffusionMat始终优于现有方法。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/85047406-ad03-419e-a4d7-fa792c69a475.png" width="800px"/>git clone https://github.com/cnnlstm/DiffusionMat.git
cd DiffusionMat
可以使用提供的diffusionmat.yaml文件设置环境:
conda env create -f diffusionmat.yaml
请下载我们的预训练模型并放置在./pretrained_models目录中。
| 模型 | 描述 |
|---|---|
| P3M | 在P3M上训练。 |
| Composition-1k | 在Composition-1k上训练。 |
| 扩散模型 | 无条件Alpha遮罩扩散。 |
| SwinTransformer | 预训练的SwinTransformer。 |
我们提供了来自Composition-1k数据集的4个样本用于快速推理:
python inference.py --exp samples/alphas_pred --config matte.yml --delta_config deltablock.yml --sample -i images --t 250 --sample_step 5 --ni
Composition-1k数据集的完整测试集可以在此下载:Composition-1k-Testset
P3M数据集可以在此下载:P3M数据集
请记得修改此处的测试集路径
使用官方评估MATLAB代码**./DIM_evaluation_code/evaluate.m**(由Deep Image Matting提供)评估Composition-1k的结果
使用官方评估Python代码评估P3M的结果
要获取Composition-1k 数据集的训练集,请参考:Matteformer
请在此处修改训练集路径
python train.py --exp training_dir --config matte.yml --delta_config deltablock.yml --sample -i images --t 250 --sample_step 5 --ni
如果您发现这项工作对您的研究有用,请引用:
@article{xu2023diffusionmat,
title={DiffusionMat: Alpha Matting as Sequential Refinement Learning},
author={Xu, Yangyang and He, Shengfeng and Shao, Wenqi and Wong, Kwan-Yee K and Qiao, Yu and Luo, Ping},
journal={arXiv preprint arXiv:2311.13535},
year={2023}
}
我们的代码主要源自SDEdit。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。