精选计算机视觉工具:AI应用、网站与开源项目大全

IP_LAP

IP_LAP

说话人脸生成身份保持

基于身份保持的说话人脸生成新方法

FlashAvatar-code

FlashAvatar-code

FlashAvatar头像生成

基于高斯嵌入的快速数字头像重建技术

SpaTracker

SpaTracker

SpatialTracker3D追踪

将2D像素的3D空间运动轨迹可视化

AdelaiDepth

AdelaiDepth

AdelaiDepth单目深度预测

开源单目深度预测工具箱 推进3D场景重建研究

DyCo3D

DyCo3D

3D点云实例分割动态卷积

动态卷积实现鲁棒3D点云实例分割

AdelaiDet

AdelaiDet

实例分割目标检测

多任务实例级识别开源工具包

3DitScene

3DitScene

3DitScene场景编辑

通过语言指令编辑3D场景的创新技术

goliath

goliath

GoliathCodec Avatar Studio

全身虚拟化身捕捉与重建开源项目

MVHumanNet

MVHumanNet

MVHumanNet数据集

多视角日常穿着人体捕捉大规模数据集

PyMAF-X

PyMAF-X

PyMAF-X3D人体重建

单图像全身3D人体重建新技术

alfred

alfred

ALFREDAI

视觉语言导航家庭任务智能代理基准

scaling_on_scales

scaling_on_scales

S2-Wrapper多尺度特征提取

为视觉模型实现多尺度特征提取的机制

yoloexplorer

yoloexplorer

YOLOExplorer计算机视觉

高效探索和处理计算机视觉数据集的开源工具

Awesome-MVS

Awesome-MVS

MVS多视图立体视觉

多视角立体视觉算法精选资源大全

diffusion-rig

diffusion-rig

DiffusionRig人脸编辑

基于个性化先验的人脸外观编辑技术

GeoChat

GeoChat

GeoChat遥感

专为遥感领域打造的视觉语言模型

MLQuestions

MLQuestions

机器学习面试问题

65个机器学习面试问题助您备战2024年技术面试

honeybee

honeybee

Honeybee多模态大语言模型

优化多模态大语言模型性能的局部性增强投影器

torchshow

torchshow

TorchShow张量可视化

一行代码实现计算机视觉数据可视化

lang-segment-anything

lang-segment-anything

Language Segment-Anything图像分割

基于文本提示的开源图像分割工具