⚠️ 警告:本仓库中的脚本可能会损坏您的训练数据。在继续操作之前,请务必备份。
SimpleTuner 是一个专门用于训练优化的实验性脚本集合。该项目注重简单性,致力于使代码易于阅读和理解。这个代码库作为一个共享的学术练习,欢迎贡献。
在开始教程之前,请充分阅读本README,因为它包含了您可能需要首先了解的重要信息。
如果想快速开始而不阅读完整文档,可以使用快 速入门指南。
对于内存受限的系统,请参阅DeepSpeed文档,其中解释了如何使用🤗Accelerate配置Microsoft的DeepSpeed以实现优化器状态卸载。
包含Flux.1的初步训练支持:
--base_model_precision将基础模型量化为int8-quanto或fp8-quanto以大幅节省内存SimpleTuner与PixArt Sigma有广泛的训练集成 - 600M和900M模型都可以无缝加载。
请参阅PixArt快速入门指南开始训练。
Stable Diffusion 2.1在微调过程中以难度著称,但事实并非如此。SimpleTuner中相关的功能包括:
请参阅Stable Diffusion 3快速入门开始使用。
一个基于SDXL的模型, 使用ChatGLM(通用语言模型)6B作为其文本编码器,将隐藏维度大小翻倍,大幅增加了提示嵌入中包含的局部细节水平。
Kolors支持几乎与SDXL一样深入,除了不支持ControlNet训练。
EMA(指数移动平均)权重是一种内存密集型操作,但在训练结束时提供出色的结果。像--ema_cpu_only这样的选项可以通过将EMA权重加载到CPU并保持在那里来改善这种情况。
没有EMA,必须更加小心,不要通过使用正则化数据来大幅改变模型,导致"灾难性遗忘"。
xformers,它可能比Nvidia同等产品使用更多内存Flux更适合使用多个GPU进行训练。
ubuntu.sh - 这是一个基本的"安装程序",可在Vast.ai实例上快速部署。它可能不适用于每个容器镜像。train.sh - SDXL的主要训练脚本。config/config.env.example - 这些是训练参数,您应该复制到config/config.env有关SimpleTuner附带的相关工具包的更多信息,请参阅工具包文档。
详细的设置信息可在安装文档中找到。
通过在环境文件中添加export SIMPLETUNER_LOG_LEVEL=DEBUG来启用调试日志,以获得更详细的洞察。
对于训练循环的性能分析,设置SIMPLETUNER_TRAINING_LOOP_LOG_LEVEL=DEBUG将显示时间戳,突出显示配置中的任何问题。
有关可用选项的完整列表,请参阅此文档。
如需更多帮助或与志同道合的人讨论训练,请加入我们的Discord服务器


AI 图片生成平台
GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。


AI 图片生成工具
输入简单文字,生成想要的图片。支持Nano Banana/gptimage-2等最新模型。


你的AI Agent团队
Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。


全球首个AI音乐社区
音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。


阿里Qoder团队推出的桌面端AI智能体
QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。


一站式搞定所有学习需求
不再被海量信息淹没,开始真正 理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。


为AI短剧协作而生
专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。


能听懂你表达的视频模型
Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。


国内直接访问,限时3折
输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝 切换,提升50%效率!
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号