Video-P2P是一项创新的视频编辑框架,通过交叉注意力控制实现了对真实世界视频的精确编辑。它克服了当前缺乏大规模视频生成模型的限制,巧妙地将图像生成扩散模型应用于视频编辑任务,为视频创作者提供了强大而灵活的编辑工具。
DUSt3R是一种创新的3D视觉算法,它使用神经网络从无约束图像中直接重建3D场景,无需相机参数。本文详细介绍了DUSt3R的工作原理、应用场景及其在3D视觉领域带来的重大突破。