最佳Github AI工具与开源项目集锦

UniAnimate

UniAnimate

UniAnimate视频生成

统一视频扩散模型实现一致性人物图像动画

Infusion

Infusion

3D Gaussians深度补全

基于扩散先验的3D高斯体场景修复技术

Ranni

Ranni

Ranni文本生成图像

将文本指令精确转化为图像的AI生成技术

dreamtalk

dreamtalk

DreamTalk生成说话人头像

音频驱动的表情丰富说话头像生成系统

FlashFace

FlashFace

FlashFace人像定制

高保真人物图像个性化生成技术

Cones-V2

Cones-V2

Cones 2图像合成

多主体自定义图像合成的创新方法

AnyDoor

AnyDoor

AnyDoor图像定制

实现对象级图像灵活定制和编辑

dive-into-llms

dive-into-llms

大模型编程实践

大语言模型实践教程

RAG-Survey

RAG-Survey

RAG检索增强生成

RAG技术全面综述 基础方法、增强技术及未来方向

SurviveSJTUManual

SurviveSJTUManual

上海交通大学生存手册

上海交大本科生活全方位攻略与生存指南

awesome-contrastive-self-supervised-learning

awesome-contrastive-self-supervised-learning

对比学习自监督学习

对比自监督学习论文和资源汇总

docs

docs

Neural Magic深度学习

Neural Magic深度学习模型CPU性能优化平台

Segment-Any-Point-Cloud

Segment-Any-Point-Cloud

点云分割自监督学习

视觉基础模型驱动的通用点云序列分割框架

prompt-to-prompt

prompt-to-prompt

Prompt-to-Prompt图像编辑

基于注意力控制的提示词驱动图像编辑技术

AnimateLCM

AnimateLCM

AnimateLCMAI动画生成

基于解耦一致性学习的快速个性化动画生成模型

groundingLMM

groundingLMM

GLaMM多模态模型

结合视觉分割和对话生成的多模态AI模型

VideoElevator

VideoElevator

VideoElevator视频生成

融合文本到图像技术提升AI视频生成质量

FollowYourClick

FollowYourClick

Follow-Your-Click图像动画

基于短提示的开放域图像区域动画生成技术

DiffTumor

DiffTumor

DiffTumor肿瘤合成

基于扩散模型的跨器官早期肿瘤合成与检测方法

Seeing-and-Hearing

Seeing-and-Hearing

视频音频生成多模态生成

创新框架实现多任务视听内容生成