Zero2Story

Zero2Story

基于人工智能的交互式故事生成框架

Zero2Story是一个结合PaLM API、Stable Diffusion和MusicGen技术的故事生成框架。该框架包含背景设置、角色创建和交互式故事生成三个阶段,使创作者能够构建独特的故事。系统支持自定义故事场景、氛围和角色,并通过AI生成的情节选项推进剧情。此外,框架还能生成与故事情境匹配的背景图像和音乐,丰富整体创作体验。

Zero2StoryAI创作交互式故事生成图像生成音乐生成Github开源项目

从零到故事

从零到故事是一个建立在PaLM APIStable DiffusionMusicGen之上的框架,让普通人能够创作自己的故事。这个框架包括背景设置角色设置互动故事生成三个阶段。

1. 背景设置:在这个阶段,用户可以设置故事的体裁、地点和氛围。特别是体裁,它是其他元素所依赖的关键。

2. 角色设置:在这个阶段,用户可以设置最多四个角色。对于每个角色,用户可以决定其特征和基本信息,如姓名、年龄、MBTI和性格。此外,还可以根据这些信息使用Stable Diffusion生成每个角色的图像。

  • PaLM API将给定的角色信息转换为Stable Diffusion能有效理解的关键词列表。
  • 然后,Stable Diffusion使用这些关键词作为提示生成图像。

3. 互动故事生成:在这个阶段,最初的几个段落完全基于背景和角色设置阶段的信息生成。之后,用户可以从PaLM API生成的三个选项中选择一个方向。然后,根据用户的选择生成后续故事。这种选择选项和生成后续故事的循环会不断重复,直到用户决定停止。

  • 在每次故事生成中,用户还可以使用Stable Diffusion和MusicGen生成描述每个场景的背景图像和音乐。
  • 如果用户对每轮生成的故事、选项、图像和音乐不满意,可以要求重新生成。

前提条件

PaLM API 密钥

这个项目严重依赖PaLM API。如果你想在自己的环境中运行它,你需要获取PaLM API 密钥并将其粘贴到根目录下的.palm_api_key.txt文件中。

ChatGPT API 密钥(可选)

可选地,你还可以添加ChatGPT API支持以增强聊天功能。如果你希望在你的环境中使用ChatGPT聊天模式,需要获取ChatGPT API密钥。获得密钥后,在项目的根目录下创建一个名为.openai_api_key.txt的文件,并在其中插入你的ChatGPT API密钥。这一步是可选的,只有在你想启用ChatGPT API提供的额外聊天功能时才需要。

软件包

确保你已在开发机器上安装了以下所有先决条件:

  • CUDA Toolkit 11.8 和 cuDNN 8 - 下载并安装 CUDA Toolkit 强烈建议在GPU上运行。如果在CPU环境中运行,速度会非常慢。
  • Poetry - 下载并安装 Poetry 这是Python的包装和依赖管理器。
  • SQLite3 v3.35.0 或更高版本 - 由于依赖关系,需要安装。
    • Ubuntu 22.04 及更高版本
    $ sudo apt install libc6 sqlite3 libsqlite3
    • Ubuntu 20.04
    $ sudo sh -c 'cat <<EOF >> /etc/apt/sources.list deb http://archive.ubuntu.com/ubuntu/ jammy main deb http://security.ubuntu.com/ubuntu/ jammy-security main EOF' $ sudo apt update $ sudo apt install libc6 sqlite3 libsqlite3
  • FFmpeg(可选) - 安装FFmpeg可以实现本地视频混合,从而比其他方法更快地生成结果
    $ sudo apt install ffmpeg

安装

在首次运行应用程序之前,安装所需的依赖项:

$ poetry install

如果将来依赖项发生变化或需要更新,可以使用:

$ poetry update

运行

$ poetry run python app.py

待办事项

  • 将生成的故事导出为PDF

Stable Diffusion 模型信息

检查点

VAE

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多