Pallaidium

Pallaidium

Blender集成的AI生成视频制作工具

Pallaidium是一个集成于Blender视频编辑器的AI生成工具。它可将文本、图像或视频转换为新的视频、图像和音频内容。主要功能包括文本生成视频、语音合成、图像处理等,并支持批量操作。该工具为视频创作者提供了AI辅助制作能力,有助于提高内容创作效率。

PallaidiumAI生成视频编辑Blender深度学习Github开源项目

PALLAIDIUM - 集成到Blender视频编辑器中的生成式AI电影工作室

从文本提示或视频、图像、文本条生成AI视频、图像和音频。

PallAIdium

Discord

https://discord.gg/csBJhBtE

功能

文本生成视频文本生成音频
文本转语音文本生成图像
图像生成图像图像生成视频
视频生成视频图像转文本
ControlNetOpenPose
ADetailerIP Adapter 人脸/风格
CannyIllusion
多个LoRASegmind蒸馏SDXL
种子质量步骤
帧数词语权重
风格选择器条带权重
批量转换批量优化图像
批量放大和优化视频模型卡选择器
渲染路径选择器渲染完成通知
模型卡一键安装和卸载依赖
用户自定义生成文件路径种子和提示添加到条带名称

image

要求

  • Windows(不支持Linux和MacOS)
  • 支持CUDA的Nvidia显卡,至少6 GB显存
  • CUDA: 12.4
  • 20+ GB硬盘空间(每个模型6+ GB)

对于Mac和Linux,我们需要依靠贡献者的支持。请在这里发布Mac相关问题:https://github.com/tin2tin/Pallaidium/issues/106,在这里发布Linux相关问题:https://github.com/tin2tin/Pallaidium/issues/105,希望有贡献者愿意帮助你。

如何安装

  • 首先,下载并安装git(必须在PATH中):https://git-scm.com/downloads

  • 下载插件:https://github.com/tin2tin/text_to_video/archive/refs/heads/main.zip

  • 在Windows上,右键单击Blender图标并选择"以管理员身份运行Blender"(否则会出现写入权限错误)

  • 按常规方式安装插件:首选项 > 插件 > 安装 > 选择文件 > 启用插件

  • 在生成式AI插件首选项中,点击"卸载依赖项"按钮(清除任何不兼容的库)

  • 重启Blender

  • 在生成式AI插件首选项中,点击"安装依赖项"按钮

  • 重启Blender

  • 在序列编辑器 > 侧边栏 > 生成式AI中打开插件UI

  • 首次执行任何模型时,需要先下载5-10 GB的数据

提示
如果缺少任何Python模块,使用此插件手动安装:
https://github.com/amb/blender_pip

更新日志

  • 2024-8-5:添加:Flux Dev - 注意:需要更新依赖项和24 GB显存
  • 2024-8-2:添加:Flux Schnell - 注意:需要更新依赖项和24 GB显存
  • 2024-7-12:添加:Kwai/Kolors(文本生成图像和图像生成图像)
  • 2024-6-13:添加:SD3 - 需要输入HuggingFace的"Read"令牌,它是免费的(图像生成图像)。修复:依赖项安装
  • 2024-6-6:添加:Stable Audio Open,帧数:-1将继承持续时间
  • 2024-6-1:IP Adapter(使用SDXL时):人脸(图像或文件夹),风格(图像或文件夹)新图像模型:Mobius、OpenVision、Juggernaut X Hyper
  • 2024-4-29:添加:PixArt Sigma 2k、PixArt 1024和RealViz V4
  • 2024-2-23:添加:Proteus Lightning和Dreamshaper XL Lightning
  • 2024-2-21:添加:SDXL-Lightning 2 Step和Proteus v. 0.3
  • 2024-1-02:添加:WhisperSpeech
  • 2024-01-01:修复安装和Bark错误
  • 2024-01-31:添加OpenDalle、速度选项、SDXL,以及Canny和OpenPose的LoRA支持,包括OpenPose骨架图像。清理旧模型包括SD
  • 2023-12-18:添加:Bark音频增强,Segmind Vega
  • 2023-12-1:添加SD Turbo和MusicGen Medium,MacOS的MPS设备
  • 2023-11-30:添加:SVD、SVD-XT、SDXL Turbo

位置

在插件首选项中安装依赖项,并设置声音通知: 图片

视频序列编辑器 > 侧边栏 > 生成式AI:

图片

风格:

图片

在此查看SDXL处理大多数风格: https://stable-diffusion-art.com/sdxl-styles/

提示:

https://replicate.com/blog/get-the-best-from-stable-diffusion-3

https://github.com/invoke-ai/InvokeAI/blob/main/docs/features/PROMPTS.md

https://stablediffusion.fr/prompts

https://blog.segmind.com/generating-photographic-images-with-stable-diffusion/

提示
如果渲染图像出现问题,请在偏好设置中使用模型卡中的分辨率。
提示
如果图像播放卡顿,请选择一个条带 > 菜单 > 条带 > 电影条带 > 设置渲染大小。
提示
如果出现CUDA内存不足的提示,请重启Blender以释放内存并使其再次稳定。

批处理

选择多个条带并点击生成。执行此操作时,文件名以及找到的种子值会自动插入到提示和种子值中。但是,在插件偏好设置中可以关闭此行为。

https://github.com/tin2tin/Pallaidium/assets/1322593/28098eb6-3a93-4bcb-bd6f-53b71faabd8d

文本转音频

Bark

在此查找Bark文档: https://github.com/suno-ai/bark

  • [笑声]
  • [笑]
  • [叹气]
  • [音乐]
  • [倒吸一口气]
  • [清嗓子]
  • — 或 ... 表示犹豫
  • ♪ 表示歌词
  • 大写字母强调某个词
  • 男人/女人: 用于说话者偏好

说话人库: https://suno-ai.notion.site/8b8e8749ed514b0cbf3f699013548683?v=bc67cff786b04b50b3ceb756fd05f68c

提示
如果音频断断续续,请尝试处理更长的句子。

性能

可以通过以下指南提高性能: https://nvidia.custhelp.com/app/answers/detail/a_id/5490/~/system-memory-fallback-for-stable-diffusion

Blender新手?

观看此教程: https://youtu.be/4_MIaxzjh5Y?feature=shared

卸载

Hugging Face Diffusers模型从hub下载并保存到本地缓存目录。默认情况下,缓存目录位于:

Linux和macOS: ~/.cache/huggingface/hub

Windows: %userprofile%\.cache\huggingface\hub

您可以在这里找到并删除各个模型。

实用插件

添加渲染条带

由于生成式AI插件只能输入图像或电影条带,您需要将其他条带类型转换为电影条带。为此,可以使用此插件:

https://github.com/tin2tin/Add_Rendered_Strips

图片

VSE遮罩工具

要在序列编辑器中的剪辑上创建遮罩,可以使用此插件将剪辑作为背景输入到Blender图像编辑器中。然后可以将创建的遮罩作为条带添加到VSE中,并使用上述插件转换为视频:

https://github.com/tin2tin/vse_masking_tools

图片

字幕编辑器

编辑和导航生成的文本条带。

https://github.com/tin2tin/Subtitle_Editor

编剧助手

使用chatGPT生成故事,可用作提示。

https://github.com/tin2tin/Blender_Screenwriter_Assistant_chat_GPT

文本转条带

将文本编辑器中的文本转换为条带,可用作批量生成的提示。

https://github.com/tin2tin/text_to_strip

实用项目

LoRAs训练器: https://github.com/Nerogar/OneTrainer https://github.com/johnman3032/simple-lora-dreambooth-trainer HD Horizon(用于使SD 1.5在更高分辨率下工作的LoRA):https://civitai.com/models/238891/hd-horizon-the-resolution-frontier-multi-resolution-high-resolution-native-inferencing

Windows手动安装Triton:https://huggingface.co/madbuda/triton-windows-builds

视频示例

图像到文本

https://github.com/tin2tin/Pallaidium/assets/1322593/91eb17e4-72d6-4c69-8e5c-a3d38af5a770

幻觉扩散

https://github.com/tin2tin/Pallaidium/assets/1322593/42eadfd8-3ebf-4747-b8e0-7b79fe8626b6

涂鸦

https://github.com/tin2tin/Pallaidium/assets/1322593/c74a4e38-8b16-423b-be78-aadfbfe284dc

风格

https://github.com/tin2tin/Pallaidium/assets/1322593/b80812b4-e3be-40b0-a73b-bc55b7eeadf7

Canny边缘检测

https://github.com/tin2tin/Pallaidium/assets/1322593/a1e94e09-0147-40ae-b4c2-4ce0671b1289

OpenPose

https://github.com/tin2tin/Pallaidium/assets/1322593/ac9f278e-9fc9-46fc-a4e7-562ff041964f

剧本到电影

观看视频

图像到文本到音频

观看视频

Zeroscope

观看视频

Würstchen

观看视频

Bark

观看视频

从文本条批量生成

观看视频

视频到视频:

https://github.com/tin2tin/Generative_AI/assets/1322593/c044a0b0-95c2-4b54-af0b-45bc0c670c89

https://github.com/tin2tin/Generative_AI/assets/1322593/0105cd35-b3b2-49cf-91c1-0633dd484177

图像到图像:

https://github.com/tin2tin/Generative_AI/assets/1322593/2dd2d2f1-a1f6-4562-8116-ffce872b79c3

绘画

https://github.com/tin2tin/Generative_AI/assets/1322593/7cd69cd0-5842-40f0-b41f-455c77443535

增强信息

LCM

https://huggingface.co/blog/lcm_lora

使用Pallaidium的限制:

  • 禁止使用Pallaidium生成贬低或伤害他人、其环境、文化、宗教等的内容。
  • 禁止使用Pallaidium生成色情、暴力和血腥内容。
  • 禁止使用Pallaidium生成错误和虚假信息。

使用AI模型的限制:

  • Pallaidium不包含任何生成式AI模型(权重)。如果用户决定使用模型,它将从HuggingFace下载。
  • 通常,这些模型只能用于非商业目的,并且仅用于研究目的。
  • 请查阅HuggingFace上各个模型的许可证,了解它们是否可以商业使用等信息。

编辑推荐精选

商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

即梦AI

即梦AI

一站式AI创作平台

提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作

扣子-AI办公

扣子-AI办公

AI办公助手,复杂任务高效处理

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
下拉加载更多