BrushNet是一种创新的图像修复模型,采用双分支扩散结构,可以无缝集成到任何预训练的扩散模型中,为图像修复任务带来了新的可能性。
CustomNet是一种新颖的对象定制方法,它将3D新视角合成能力明确地整合到对象定制过程中,实现了对视角、位置和背景的同时控制,大大提升了生成图像的多样性和对象身份保持能力。
AnimeSR是一种针对动画视频的实际场景超分辨率模型,通过学习真实世界的退化操作、构建大规模动画数据集以及设计高效的多尺度网络结构,实现了动画视频超分辨率效果和效率的显著提升。
d2l-pytorch-slides是一个包含自动生成的深度学习教程幻灯片的GitHub仓库,基于PyTorch框架实现。它提供了丰富的Jupyter notebook形式的教学幻灯片,涵盖了从基础到高级的各种深度学习主题。
Keras Core是Keras API的多后端实现,支持TensorFlow、JAX和PyTorch,为深度学习开发者提供了前所未有的灵活性和可移植性。
KerasCV是一个基于Keras构建的先进计算机视觉库,提供了丰富的模型、数据增强和任务工具,支持TensorFlow、JAX和PyTorch多后端,助力开发者快速构建高性能的视觉AI应用。
Normal-Depth Diffusion是一种新型的文本到3D生成模型,能够从文本描述生成高质量的法向图和深度图,为3D内容创作开辟了新的可能性。
Magic Clothing是一项创新的人工智能技术,专注于可控的服装驱动图像合成。它是OOTDiffusion的分支版本,能够根据给定的服装图像和文本提示生成高质量的人物穿着图像,为虚拟试衣和时尚设计等领域带来了新的可能性。
ComfyUI-AnimateAnyone-Evolved 是一个改进的 AnimateAnyone 实现,允许用户使用 OpenPose 图像序列和参考图像来生成风格化视频,旨在为 AI 动画创作提供更高效、更灵活的解决方案。
本文对低光照图像和视频增强(LLIE)领域进行了全面综述,涵盖了从传统方法到深度学习的各种技术。文章介绍了LLIE的发展历程、主要方法分类、代表性算法、数据集、评价指标等多个方面,并探讨了该领域的未来发展方向。
C2PNet是一种创新的单图像去雾算法,通过引入课程对比正则化和物理感知双分支结构,实现了在SOTS数据集上的最佳性能。本文详细介绍了C2PNet的原理、架构和使用方法。
本文深入探讨了扩散模型在图像处理领域的最新应用与研究进展,重点介绍了超分辨率重建、图像恢复、图像修复等多个热门方向的代表性工作,并对未来发展趋势进行了展望。
本文全面介绍了Mamba模型在图像超分辨率、图像去雨、图像去模糊等低层视觉任务中的最新研究进展,并探讨了Mamba模型在这一领域的优势和未来发展方向。
本文深入探讨了CVPR 2023亮点论文提出的ReLA方法,该方法旨在解决广义指代表达分割(GRES)任务,通过创新的模型架构和训练策略,在多个数据集上取得了优异的性能。
FreeU是一种革命性的扩散模型优化方法,无需额外训练或参数即可显著提升生成质量。本文深入探讨FreeU的原理、实现和应用,展示其在各种扩散模型中的卓越表现。
本文全面介绍了6D对象姿态估计领域的最新进展,包括研究现状、主要方法、数据集、挑战和未来方向等,为该领域的研究者提供了系统的参考。
SimpleView是一个用于点云形状分类的简单而高效的方法。它在ScanObjectNN和ModelNet40等基准数据集上取得了最先进的性能,同时保持了模型的简洁性和效率。本文将详细介绍SimpleView的原理、实现和应用。
本文深入探讨了Awesome-Text-to-3D项目,详细介绍了文本到3D生成领域的最新研究进展、关键技术和代表性工作,全面展现了这一前沿技术的发展现状和未来趋势。
Real3D是一种创新的大规模重建模型(LRM)系统,可以利用单视图真实世界图像进行训练,在多个评估设置中均优于现有方法,为真实场景三维重建开辟了新的可能性。
本文详细介绍了如何使用TensorRT加速深度学习模型推理,包括TensorRT的基本概念、安装配置、PyTorch模型转换、性能优化等内容,是一篇实用的TensorRT入门指南。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号