min-max-gpt是一个仅用400行代码实现的极简GPT训练框架,支持多节点分布式训练和全面分片数据并行(FSDP)等高级功能,旨在提供最大化的GPT模型训练能力。
探索PFGM++模型如何结合物理学原理与深度学习,为生成模型领域带来创新突破。本文深入分析了PFGM++的核心思想、技术细节及其在图像生成等任务中的卓越表现。
SpeeD是一种新颖的扩 散模型训练加速方法,通过对时间步长的深入研究,实现了训练速度提升3倍的突破性成果。本文详细介绍了SpeeD的原理、优势及其在图像生成任务中的应用。
EvTexture是一种创新的视频超分辨率技术,利用事件相机捕获的高时间分辨率信息来增强视频纹理细节。该方法在ICML 2024会议上发表,展现了优异的性能,为视频超分辨率领域带来了新的研究方向。
EasyAnimate是一个基于Transformer扩散模型的端到端解决方案,用于高分辨率和长视频生成。它支持直接从预训练模型生成不同分辨率的6秒24fps视频,并允许用户训练自定义基线模型和Lora模型进行特定风格转换。
Poutyne是一个基于PyTorch的简化深度学习框架,它能够帮助研究人员和开发者更高效地构建和训练神经网络模型。本文将深入介绍Poutyne的特性、使用方法及其在深度学习开发中的优势。
Swift Diffusion是一个用Swift语言重新实现的Stable Diffusion模型,旨在为移动设备如iPad和iPhone提供高效的图像生成能力。该项目通过对模型进行优化,有望在移动设备上运行大型AI模型。