最佳扩散模型工具集合:AI应用与资源指南

SurfD

SurfD

3D建模深度学习

利用扩散模型生成任意拓扑结构的高质量3D表面

3DTopia

3DTopia

3DTopia文本到3D生成

创新的文本到3D模型生成系统

videocomposer

videocomposer

VideoComposer视频合成

灵活可控的视频合成与运动模式生成工具

UniAnimate

UniAnimate

UniAnimate视频生成

统一视频扩散模型实现一致性人物图像动画

Infusion

Infusion

3D Gaussians深度补全

基于扩散先验的3D高斯体场景修复技术

dreamtalk

dreamtalk

DreamTalk生成说话人头像

音频驱动的表情丰富说话头像生成系统

prompt-to-prompt

prompt-to-prompt

Prompt-to-Prompt图像编辑

基于注意力控制的提示词驱动图像编辑技术

AnimateLCM

AnimateLCM

AnimateLCMAI动画生成

基于解耦一致性学习的快速个性化动画生成模型

VideoElevator

VideoElevator

VideoElevator视频生成

融合文本到图像技术提升AI视频生成质量

Seeing-and-Hearing

Seeing-and-Hearing

视频音频生成多模态生成

创新框架实现多任务视听内容生成

RAVE

RAVE

RAVE视频编辑

基于扩散模型的高效视频编辑技术

MultiBooth

MultiBooth

MultiBooth图像生成

基于文本的多概念图像生成技术

DiffSHEG

DiffSHEG

DiffSHEG语音驱动生成

基于扩散模型的实时语音驱动3D表情和手势生成技术

DiT-MoE

DiT-MoE

DiT-MoE扩散模型

16亿参数规模的稀疏化扩散Transformer模型

DiffSynth-Studio

DiffSynth-Studio

DiffSynth Studio扩散模型

多功能扩散模型引擎 支持长视频合成与图像生成

Awesome-AIGC-3D

Awesome-AIGC-3D

AIGC3D生成

最新生成式3D模型技术和资源汇总

PixArt-alpha

PixArt-alpha

PixArt-α文本生成图像

高效训练的Transformer扩散模型实现逼真文本到图像生成

audio-ai-timeline

audio-ai-timeline

AI音频生成文本转语音

音频AI领域2023年重大进展及模型概览

ctm

ctm

CTM扩散模型

创新的单步扩散模型采样方法

Awesome-Video-Diffusion

Awesome-Video-Diffusion

视频生成扩散模型

人工智能视频生成与编辑技术资源大全