text-to-video-synthesis-colab

text-to-video-synthesis-colab

多模型文本到视频合成工具集成

该开源项目集成了Longscope、Zeroscope和Potat1等多个文本到视频合成模型。用户可在Colab环境中,通过输入文本生成短视频。项目支持多种分辨率和风格选择,并包含视频增强功能。这一工具集适用于多种创意和内容制作场景,为AI视频创作提供了便利。

文本生成视频ColabAI模型Hugging Face开源项目Github

🐣 请在Twitter上关注我以获取最新更新 https://twitter.com/camenduru <br /> 🔥 欢迎加入我们的Discord服务器 https://discord.gg/k5BwmmvJJU <br /> 🥳 诚邀您加入我的Patreon社区 https://patreon.com/camenduru <br />

🦒 Colab

Colab类型
在 Colab 中打开longscope 文本生成视频 Colab polyware-ai/longscope <br /> (感谢 @polyware_ai ❤ 提供模型)
在 Colab 中打开zeroscope v2 xl 文本生成视频 Colab cerspense/zeroscope_v2_XL <br /> (感谢 @cerspense ❤ 提供模型)
在 Colab 中打开zeroscope v2 576w 文本生成视频 Colab cerspense/zeroscope_v2_576w <br /> (感谢 @cerspense ❤ 提供模型)
在 Colab 中打开potat1 exp1 文本生成视频 Colab (感谢 lambda labs ❤ 提供 GPU)
在 Colab 中打开zeroscope v2 dark 文本生成视频 Colab cerspense/zeroscope_v2_dark_30x448x256 <br /> (感谢 @cerspense ❤ 提供模型)
在 Colab 中打开zeroscope v2 30x448x256 文本生成视频 Colab cerspense/zeroscope_v2_30x448x256 <br /> (感谢 @cerspense ❤ 提供模型)
在 Colab 中打开zeroscope v1.1 320s 文本生成视频 Colab cerspense/zeroscope_v1-1_320s <br /> (感谢 @cerspense ❤ 提供模型)
在 Colab 中打开potat1 文本生成视频 Colab camenduru/potat1 (感谢 lambda labs ❤ 提供 GPU)
在 Colab 中打开zeroscope v1 320s 文本生成视频 Colab cerspense/zeroscope_v1_320s <br /> (感谢 @cerspense ❤ 提供模型)
在 Colab 中打开ms 1.7b 文本生成视频 Colab damo-vilab/text-to-video-ms-1.7b <br /> (感谢 damodamo-vilab ❤ 提供模型)
在 Colab 中打开animov 512x 文本生成视频 Colab strangeman3107/animov-512x <br /> (感谢 @bRuefiRe ❤ 提供模型)
在Colab中打开animov_0_1_1_text_to_video_colab strangeman3107/animov-0.1.1 <br /> (感谢 @bRuefiRe ❤ 提供的模型)

在Colab中打开 | animov_0_1_text_to_video_colab strangeman3107/animov-0.1.1 <br /> (感谢 @bRuefiRe ❤ 提供的模型)

在Colab中打开 | 水印去除器

在Colab中打开 | 文本转视频合成 <br /> (感谢 damodamo-vilab ❤ 提供的模型)

在Colab中打开 | 文本转视频合成_扩散器 <br /> (感谢 damodamo-vilab ❤ 提供的模型)

<!-- [![在 Colab 中打开](https://yellow-cdn.veclightyear.com/0a4dffa0/a0a68667-3c24-4367-b0f2-abab69803d53.svg)](https://colab.research.google.com/github/camenduru/text-to-video-synthesis-colab/blob/main/zeroscope_video_webui_colab.ipynb) | zeroscope_video_webui_colab [cerspense/zeroscope_v2_576w](https://huggingface.co/cerspense/zeroscope_v2_576w) (576x320 文本生成视频) <br /> [cerspense/zeroscope_v2_30x448x256](https://huggingface.co/cerspense/zeroscope_v2_30x448x256) (448x256 文本生成视频) <br /> [cerspense/zeroscope_v2_XL](https://huggingface.co/cerspense/zeroscope_v2_XL) <br /> (1024x576 视频到视频去噪强度在0.66到0.85之间) <br /> (感谢 [@cerspense](https://twitter.com/cerspense) ❤ 提供模型) <br /> (感谢 [@kabachuha](https://github.com/kabachuha) ❤ 提供 [text2video webui 扩展](https://github.com/deforum-art/sd-webui-text2video)) [![在 Colab 中打开](https://yellow-cdn.veclightyear.com/0a4dffa0/a0a68667-3c24-4367-b0f2-abab69803d53.svg)](https://colab.research.google.com/github/camenduru/text-to-video-synthesis-colab/blob/main/zeroscope_v2_576w_video_webui_colab.ipynb) | zeroscope_v2_576w_video_webui_colab [cerspense/zeroscope_v2_576w](https://huggingface.co/cerspense/zeroscope_v2_576w) <br /> (576x320 文本生成视频) <br /> (感谢 [@cerspense](https://twitter.com/cerspense) ❤ 提供模型) <br /> (感谢 [@kabachuha](https://github.com/kabachuha) ❤ 提供 [text2video webui 扩展](https://github.com/deforum-art/sd-webui-text2video)) [![在 Colab 中打开](https://yellow-cdn.veclightyear.com/0a4dffa0/a0a68667-3c24-4367-b0f2-abab69803d53.svg)](https://colab.research.google.com/github/camenduru/text-to-video-synthesis-colab/blob/main/zeroscope_upscale_video_webui_colab.ipynb) | zeroscope_upscale_video_webui_colab [cerspense/zeroscope_v2_XL](https://huggingface.co/cerspense/zeroscope_v2_XL) <br /> (1024x576 视频到视频去噪强度在0.66到0.85之间) <br /> (感谢 [@cerspense](https://twitter.com/cerspense) ❤ 提供模型) <br /> (感谢 [@kabachuha](https://github.com/kabachuha) ❤ 提供 [text2video webui 扩展](https://github.com/deforum-art/sd-webui-text2video)) [![在 Colab 中打开](https://yellow-cdn.veclightyear.com/0a4dffa0/a0a68667-3c24-4367-b0f2-abab69803d53.svg)](https://colab.research.google.com/github/camenduru/text-to-video-synthesis-colab/blob/main/potat1_video_webui_colab.ipynb) | potat1_video_webui_colab (1024x576 文本生成视频) (感谢 [lambda labs](https://lambdalabs.com/) ❤ 提供 GPU) -->

🦒 社区 Colab

Colab功能作者说明
在 Colab 中打开potat1_text_to_video_colab_ALM (感谢 snydjos ❤)snydjos AILostMedia说明

教程

https://www.youtube.com/watch?v=WHcjD-uraUs (适用于 zeroscope_video_webui_colab 和 zeroscope_upscale_video_webui_colab) <br /> https://www.youtube.com/watch?v=E45AO1w9gRU (适用于 Potat 1️⃣ 和 Zeroscope) <br /> https://www.youtube.com/watch?v=b8D4am73e6I <br />

主要仓库

https://www.modelscope.cn/models/damo/text-to-video-synthesis/summary <br /> https://github.com/modelscope/modelscope <br /> https://github.com/huggingface/diffusers <br />

论文

https://arxiv.org/abs/2308.06571

模型许可

Apache License 2.0

示例

Potat 1️⃣

https://github.com/camenduru/text-to-video-synthesis-colab/assets/54370274/604a8817-5ad3-421a-9240-e5d3b195074d

https://github.com/camenduru/text-to-video-synthesis-colab/assets/54370274/842da028-df43-4dba-bb14-a41d66edeb4e

https://github.com/camenduru/text-to-video-synthesis-colab/assets/54370274/c5201c8a-2815-4533-9474-1e312c564f4e

https://github.com/camenduru/text-to-video-synthesis-colab/assets/54370274/281d1a9e-b930-4e8a-9554-5203e15b4425

https://github.com/camenduru/text-to-video-synthesis-colab/assets/54370274/0bb74810-13bf-4e20-950f-b569a60ea5c8

https://github.com/camenduru/text-to-video-synthesis-colab/assets/54370274/1025f302-9fa1-4bd3-8996-1da94697151e

基础模型

<table><tbody><tr><td><center> 长颈鹿在微波炉下方。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/43bc2a87-d93b-453a-a933-0d9ba3c8af54.gif" alt="长颈鹿在微波炉下方。" style="width: 300px;"> </center></td><td><center> 一只金毛寻回犬在湖边公园玩耍。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/98c8e9be-8adc-428e-b9bf-0724d77f6d2a.gif" alt="一只金毛寻回犬在湖边公园玩耍。" style="width: 300px;"> </center></td><td><center> 熊猫开车。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/828861b8-8759-4508-b040-b835e36b1bf3.gif" alt="熊猫开车。" style="width: 300px;"> </center></td></tr><tr><td><center> 泰迪熊在纽约市奔跑。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/0ec9e5c2-26a4-4e1a-838e-fb2e93da15ac.gif" alt="泰迪熊在纽约市奔跑。" style="width: 300px;"> </center></td><td><center> 无人机穿越反乌托邦外星球上的 <br>快餐店。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/63fc1aa8-6b05-4e9f-9df2-c171c697f40e.gif" alt="无人机穿越反乌托邦外星球上的快餐店。" style="width: 300px;"> </center></td><td><center> 一只身穿红色斗篷超级英雄装的狗 <br>在天空中飞翔。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/f99cfccc-df0e-487f-999c-d26e47df1dad.gif" alt="一只身穿红色斗篷超级英雄装的狗在天空中飞翔。" style="width: 300px;"> </center></td></tr><tr><td><center> 猴子学弹钢琴。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/6c54b214-dc0f-4d52-93e5-152fbec7bb03.gif" alt="猴子学弹钢琴。" style="width: 300px;"> </center></td><td><center> 一窝小狗在院子里奔跑。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/8a948edc-3d4f-4255-a60b-7a38f4cbf9fa.gif" alt="一窝小狗在院子里奔跑。" style="width: 300px;"> </center></td><td><center> 机器人在时代广场跳舞。 <br> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/aa20ff3b-8bbd-4551-86dc-1818bb92e0b1.gif" alt="机器人在时代广场跳舞。" style="width: 300px;"> </center></td></tr></tbody></table>

相关Colab

https://github.com/camenduru/text2video-zero-colab

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多