最佳Github AI工具与开源项目集锦

UNI

UNI

UNI计算病理学

革新计算病理学的通用自监督模型

VideoLLaMA2

VideoLLaMA2

VideoLLaMA2视频理解

增强视频理解的多模态语言模型

CameraCtrl

CameraCtrl

CameraCtrl视频生成

AI视频生成模型实现精准相机轨迹控制

DiT-MoE

DiT-MoE

DiT-MoE扩散模型

16亿参数规模的稀疏化扩散Transformer模型

FasterLivePortrait

FasterLivePortrait

FasterLivePortraitAI换脸

高效实时AI人像动画生成框架

awesome-ebm

awesome-ebm

能量模型机器学习

全面汇总能量函数模型与学习资源

UltraPixel

UltraPixel

UltraPixel高分辨率图像合成

先进的超高分辨率图像合成技术

aura-sr

aura-sr

AuraSR超分辨率

基于GAN的真实世界图像超分辨率增强工具

DynamiCrafter

DynamiCrafter

DynamiCrafter视频生成

将开放域图像转化为动态视频的AI动画工具

ComfyUI

ComfyUI

ComfyUIAI绘图

模块化Stable Diffusion工作流设计与执行工具

ToonCrafter

ToonCrafter

ToonCrafter卡通插值

卡通图像插帧生成工具

shape-of-motion

shape-of-motion

4D重建单视频重建

从单个视频实现4D场景重建的前沿技术

VADER

VADER

视频生成AI

基于奖励梯度的视频生成质量优化技术

SyncTalk

SyncTalk

SyncTalk头像合成

同步技术驱动的高质量说话头像合成

vggsfm

vggsfm

VGGSfM三维重建

深度学习驱动的结构运动恢复技术

ProPainter

ProPainter

ProPainter视频修复

创新视频修复技术提升传播和变换器效果

ESFT

ESFT

ESFT大语言模型

专家专门化微调提升稀疏大语言模型性能

One2345plus

One2345plus

3D建模图像处理

单图快速生成高保真3D模型技术

DeepSeek-VL

DeepSeek-VL

DeepSeek-VL视觉语言模型

高性能开源视觉语言模型 多模态理解与复杂场景应用

DeepSeek-MoE

DeepSeek-MoE

DeepSeekMoE大语言模型

创新MoE架构打造高效大规模语言模型