精选计算机视觉工具:AI应用、网站与开源项目大全

dreamscene4d

dreamscene4d

DreamScene4D3D场景生成

从单目视频生成动态多目标3D场景的突破性技术

splatter-image

splatter-image

Splatter Image3D重建

基于单一图像的快速3D重建技术 适用于多种物体

GPS-Gaussian

GPS-Gaussian

3D Gaussian Splatting人体新视角合成

通用像素级3D高斯表示实现实时人体新视角合成

K-Planes

K-Planes

K-Planes辐射场

多维场景的显式辐射场模型,支持静态、动态和可变外观数据集

Awesome-Image-Composition

Awesome-Image-Composition

图像合成AIGC

图像合成领域资源精选 从论文到工具的全面集合

AIGS

AIGS

AI生成图像数据源

AI生成图像作为数据源的前沿探索与应用

Segment-Any-Point-Cloud

Segment-Any-Point-Cloud

点云分割自监督学习

视觉基础模型驱动的通用点云序列分割框架

FollowYourClick

FollowYourClick

Follow-Your-Click图像动画

基于短提示的开放域图像区域动画生成技术

ARC

ARC

ARC旋转目标检测

自适应旋转卷积技术提升目标检测准确度

T-Rex

T-Rex

T-Rex2目标检测

融合文本和视觉提示的通用目标检测模型

DSINE

DSINE

DSINE表面法线估计

创新表面法线估计技术提高精度和适应性

shape-of-motion

shape-of-motion

4D重建单视频重建

从单个视频实现4D场景重建的前沿技术

SyncTalk

SyncTalk

SyncTalk头像合成

同步技术驱动的高质量说话头像合成

vggsfm

vggsfm

VGGSfM三维重建

深度学习驱动的结构运动恢复技术

ProPainter

ProPainter

ProPainter视频修复

创新视频修复技术提升传播和变换器效果

TalkingGaussian

TalkingGaussian

TalkingGaussian3D说话头合成

结构持久性3D会说话头像合成的高斯散射方法

gaustudio

gaustudio

GauStudio3D Gaussian Splatting

模块化框架推动3D高斯散射技术创新与应用

Practical-RIFE

Practical-RIFE

RIFE视频插帧

开源视频插帧和增强框架

1d-tokenizer

1d-tokenizer

TiTok图像标记化

创新1D图像分词框架实现高效图像处理

mar

mar

MAR图像生成

创新自回归图像生成方法