
基于解耦一致性学习的快速个性化动画生成模型
AnimateLCM项目通过解耦一致性学习技术,实现了个性化扩散模型和适配器的快速动画生成。该模型仅需4步推理即可生成高质量动画,显著提高了训练效率。项目支持文本、控制信号和图像到视频的多种生成方式,并提供多个预训练模型。AnimateLCM在保证输出质量的同时大幅提升了动画生成速度,为个性化视频创作提供了新的技术方案。
[论文] [项目页面 ✨] [🤗Hugging Face 演示] [预训练模型] [Civitai]
作者:王福云、黄钊阳📮、施小雨、边伟康、宋广璐、刘宇、李鸿升📮
</div>| 示例 1 | 示例 2 | 示例 3 |
|---|---|---|
![]() | ![]() | ![]() |
如果您使用了我们工作的任何部分,请引用:
@article{wang2024animatelcm,
title={AnimateLCM: Accelerating the Animation of Personalized Diffusion Models and Adapters with Decoupled Consistency Learning},
author={Wang, Fu-Yun and Huang, Zhaoyang and Shi, Xiaoyu and Bian, Weikang and Song, Guanglu and Liu, Yu and Li, Hongsheng},
journal={arXiv preprint arXiv:2402.00769},
year={2024}
}
以下是使用示例的屏幕录像。提示词:"倒映山脉的河流"
一致性模型是由杨松教授提出的一种有前景的新型生成模型家族,用于快速且高质量的生成。
Animate-LCM是一项开创性工作,探索了遵循一致性模型的快速动画生成,能够在4次推理步骤内生成高质量的动画。
它依赖于解耦学习范式,首先学习图像生成先验,然后学习时间生成先验以实现快速采样,大大提高了训练效率。
AnimateLCM的高级工作流程可以概括为
<div align="center"> <img src="https://yellow-cdn.veclightyear.com/835a84d5/34324fbc-450b-40de-8e7e-988b6fdacc68.png" alt="比较" style="zoom:80%;" /> </div>我们在项目页面上发布了许多由Animate-LCM生成的演示视频。总的来说,AnimateLCM适用于快速、文本到视频、控制到视频、图像到视频、视频到视频风格化以及长视频生成。
<div align="center"> <img src="https://yellow-cdn.veclightyear.com/835a84d5/0e484d7c-41d3-4508-b38d-f7e385c1a36a.png" alt="比较" style="zoom:80%;" /> </div>到目前为止,我们已经发布了三个可供使用的模型
Animate-LCM-T2V:用于个性化视频生成的空间LoRA权重和运动模块。社区的一些尝试表明,该运动模块也与许多为LCM调 优的个性化模型兼容,例如Dreamshaper-LCM。
AnimateLCM-SVD-xt。我提供了AnimateLCM-SVD-xt和AnimateLCM-SVD-xt 1.1,它们分别从SVD-xt和SVD-xt 1.1调优而来。它们可以用1~8步生成25帧的高分辨率图像动画。你可以在Hugging Face的演示中尝试。感谢Hugging Face团队提供的GPU资源。
AnimateLCM-I2V。这是一个空间LoRA权重和一个带有额外图像编码器的运动模块,用于个性化图像动画。这是我们尝试直接训练一个图像动画模型,以实现快速采样而无需任何教师模型。它可以用2~4步生成个性化图像的动画。但由于训练资源非常有限,它的稳定性不如我希望的那样(就像大多数基于Stable-Diffusion-v1-5构建的I2V模型一样,它们在生成时通常不太稳定)。
我们将animatelcm_sd15和animatelcm_svd分成两个文件夹。它们基于不同的环境。请参考README_animatelcm_sd15和README_animatelcm_svd获取使用说明。
AnimateLCM-T2V:
AnimateLCM-I2V:
2-4步应该可以用于个性化图像动画。
在大多数情况下,模型不需要CFG值。只需将CFG设为1以减少推理成本。
我额外设置了一个"运动比例"超参数。默认设置为0.8。如果将其设置为0.0,你应该总是得到静态动画。你可以增加运动比例来获得更大的动作,但有时会导致生成失败。
典型的工作流程可以是:
AnimateLCM-SVD:
CFG_min和CFG_max。默认情况下,CFG_min设置为1。在[1, 1.5]之间稍微调整CFG_max将获得良好的结果。同样,将其设置为1以减少推理成本。AnimateLCM-T2V的屏幕录制。提示词:"戴墨镜的狗"。
我愿意进行合作,但不接受全职实习。如果你对我的一些工作感兴趣,希望以任何形式进行合作/讨论,请随时联系我。
我要感谢**AK**宣传我们的工作,感谢Hugging Face团队在构建Gradio演示和存储模型方面提供的帮助。还要感谢Dhruv Nair在diffusers方面提供的帮助。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。


企业专属的AI法律顾问
iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。


稳定高效的流量提升解决方案,助力品牌曝光
稳定高效的流量提升解决方案,助力品牌曝光


最新版Sora2模型免费使用,一键生成无水印视频
最新版Sora2模型免费使用,一键生成无水印视频
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号