本文汇总了denoising-diffusion-pytorch项目的学习资料,包括项目介绍、安装使用、相关教程等,帮助读者快速了解和上手这个PyTorch实现的去噪扩散概率模型。
SceneTex是一种创新的人工智能技术,能够为3D室内场景生成高质量、风格一致的纹理。它使用深度到图像的扩散先验,通过在RGB空间中优化纹理来实现风格和几何一致性,并引入多分辨率纹理场和交叉注意力解码器等创新设计,显著提升了纹理生成的视觉质量和提示保真度。
DiffGesture是一种新型的基于扩散模型的框架,旨在有效捕捉跨模态的音频到手势关联,并保持时间连贯性,实现高保真度的音频驱动协同语音手势生成。该方法在CVPR 2023会议上发表,相比现有方法取得了显著的性能提升。
探索可控生成技术的前沿进展,包括ControlNet、DreamBooth等代表性工作,以及在图像、视频和3D生成领域的最新应用。
DDPM-CD是一种创新的遥感变化检测方法,利用预训练的去噪扩散概率模型(DDPM)作为特征提取器,实现了高精度的变化检测效果。该方法可以充分利用大量未标注的遥感图像,通过预训练DDPM来学习遥感图像的语义信息,再通过微调实现精确的变化检测。
MACE是一种新型的扩散模型微调框架,旨在实现大规模概念消除。它能够同时消除多达100个概念,并在泛化性和特异性之间取得良好平衡,为扩散模型的安全应用开辟了新的可能。
TCD (Trajectory Consistency Distillation) 是一种创新的蒸馏技术,可以将预训练扩散模型的知识转移到几步采样器中,实现快速高质量的图像生成。本文详细介绍了TCD的原理、优势及其在各种场景下的应用。