Blender集成的AI生成视频制作工具
Pallaidium是一个集成于Blender视频编辑器的AI生成工具。它可将文本、图像或视频转换为新的视频、图像和音频内容。主要功能包括文本生成视频、语音合成、图像处理等,并支持批量操作。该工具为视频创作者提供了AI辅助制作能力,有助于提高内容创作效率。
从文本提示或视频、图像、文本条生成AI视频、图像和音频。
文本生成视频 | 文本生成音频 |
文本转语音 | 文本生成图像 |
图像生成图像 | 图像生成视频 |
视频生成视频 | 图像转文本 |
ControlNet | OpenPose |
ADetailer | IP Adapter 人脸/风格 |
Canny | Illusion |
多个LoRA | Segmind蒸馏SDXL |
种子 | 质量步骤 |
帧数 | 词语权重 |
风格选择器 | 条带权重 |
批量转换 | 批量优化图像 |
批量放大和优化视频 | 模型卡选择器 |
渲染路径选择器 | 渲染完成通知 |
模型卡 | 一键安装和卸载依赖 |
用户自定义生成文件路径 | 种子和提示添加到条带名称 |
对于Mac和Linux,我们需要依靠贡献者的支持。请在这里发布Mac相关问题:https://github.com/tin2tin/Pallaidium/issues/106,在这里发布Linux相关问题:https://github.com/tin2tin/Pallaidium/issues/105,希望有贡献者愿意帮助你。
首先,下载并安装git(必须在PATH中):https://git-scm.com/downloads
下载插件:https://github.com/tin2tin/text_to_video/archive/refs/heads/main.zip
在Windows上,右键单击Blender图标并选择"以管理员身份运行Blender"(否则会出现写入权限错误)
按常规方式安装插件:首选项 > 插件 > 安装 > 选择文件 > 启用插件
在生成式AI插件首选项中,点击"卸载依赖项"按钮(清除任何不兼容的库)
重启Blender
在生成式AI插件首选项中,点击"安装依赖项"按钮
重启Blender
在序列编辑器 > 侧边栏 > 生成式AI中打开插件UI
首次执行任何模型时,需要先下载5-10 GB的数据
提示 |
---|
如果缺少任何Python模块,使用此插件手动安装: |
https://github.com/amb/blender_pip |
在插件首选项中安装依赖项,并设置声音通知:
视频序列编辑器 > 侧边栏 > 生成式AI:
在此查看SDXL处理大多数风格: https://stable-diffusion-art.com/sdxl-styles/
https://replicate.com/blog/get-the-best-from-stable-diffusion-3
https://github.com/invoke-ai/InvokeAI/blob/main/docs/features/PROMPTS.md
https://stablediffusion.fr/prompts
https://blog.segmind.com/generating-photographic-images-with-stable-diffusion/
提示 |
---|
如果渲染图像出现问题,请在偏好设置中使用模型卡中的分辨率。 |
提示 |
---|
如果图像播放卡顿,请选择一个条带 > 菜单 > 条带 > 电影条带 > 设置渲染大小。 |
提示 |
---|
如果出现CUDA内存不足的提示,请重启Blender以释放内存并使其再次稳定。 |
选择多个条带并点击生成。执行此操作时,文件名以及找到的种子值会自动插入到提示和种子值中。但是,在插件偏好设置中可以关闭此行为。
https://github.com/tin2tin/Pallaidium/assets/1322593/28098eb6-3a93-4bcb-bd6f-53b71faabd8d
在此查找Bark文档: https://github.com/suno-ai/bark
说话人库: https://suno-ai.notion.site/8b8e8749ed514b0cbf3f699013548683?v=bc67cff786b04b50b3ceb756fd05f68c
提示 |
---|
如果音频断断续续,请尝试处理更长的句子。 |
可以通过以下指南提高性能: https://nvidia.custhelp.com/app/answers/detail/a_id/5490/~/system-memory-fallback-for-stable-diffusion
观看此教程: https://youtu.be/4_MIaxzjh5Y?feature=shared
Hugging Face Diffusers模型从hub下载并保存到本地缓存目录。默认情况下,缓存目录位于:
Linux和macOS: ~/.cache/huggingface/hub
Windows: %userprofile%\.cache\huggingface\hub
您可以在这里找到并删除各个模型。
由于生成式AI插件只能输入图像或电影条带,您需要将其他条带类型转换为电影条带。为此,可以使用此插件:
https://github.com/tin2tin/Add_Rendered_Strips
要在序列编辑器中的剪辑上创建遮罩,可以使用此插件将剪辑作为背景输入到Blender图像编辑器中。然后可以将创建的遮罩作为条带添加到VSE中,并使用上述插件转换为视频:
https://github.com/tin2tin/vse_masking_tools
编辑和导航生成的文本条带。
https://github.com/tin2tin/Subtitle_Editor
使用chatGPT生成故事, 可用作提示。
https://github.com/tin2tin/Blender_Screenwriter_Assistant_chat_GPT
将文本编辑器中的文本转换为条带,可用作批量生成的提示。
https://github.com/tin2tin/text_to_strip
LoRAs训练器: https://github.com/Nerogar/OneTrainer https://github.com/johnman3032/simple-lora-dreambooth-trainer HD Horizon(用于使SD 1.5在更高分辨率下工作的LoRA):https://civitai.com/models/238891/hd-horizon-the-resolution-frontier-multi-resolution-high-resolution-native-inferencing
Windows手动安装Triton:https://huggingface.co/madbuda/triton-windows-builds
https://github.com/tin2tin/Pallaidium/assets/1322593/91eb17e4-72d6-4c69-8e5c-a3d38af5a770
https://github.com/tin2tin/Pallaidium/assets/1322593/42eadfd8-3ebf-4747-b8e0-7b79fe8626b6
https://github.com/tin2tin/Pallaidium/assets/1322593/c74a4e38-8b16-423b-be78-aadfbfe284dc
https://github.com/tin2tin/Pallaidium/assets/1322593/b80812b4-e3be-40b0-a73b-bc55b7eeadf7
https://github.com/tin2tin/Pallaidium/assets/1322593/a1e94e09-0147-40ae-b4c2-4ce0671b1289
https://github.com/tin2tin/Pallaidium/assets/1322593/ac9f278e-9fc9-46fc-a4e7-562ff041964f
https://github.com/tin2tin/Generative_AI/assets/1322593/c044a0b0-95c2-4b54-af0b-45bc0c670c89
https://github.com/tin2tin/Generative_AI/assets/1322593/0105cd35-b3b2-49cf-91c1-0633dd484177
https://github.com/tin2tin/Generative_AI/assets/1322593/2dd2d2f1-a1f6-4562-8116-ffce872b79c3
https://github.com/tin2tin/Generative_AI/assets/1322593/7cd69cd0-5842-40f0-b41f-455c77443535
https://huggingface.co/blog/lcm_lora
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多 种场景,如有声读物制作、智能语音助手开发等。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
高分辨率纹理 3D 资产生成
Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。
一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。
3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据 存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。