精选计算机视觉工具:AI应用、网站与开源项目大全

VoxFormer

VoxFormer

VoxFormer3D语义场景补全

基于稀疏体素变换器的相机驱动3D语义场景补全方法

perceiver-pytorch

perceiver-pytorch

Perceiver深度学习

Perceiver模型的PyTorch实现 迭代注意力处理多模态数据

awesome-NeRF

awesome-NeRF

NeRF神经辐射场

全面汇总神经辐射场研究进展和应用

instruct-nerf2nerf

instruct-nerf2nerf

Instruct-NeRF2NeRF3D场景编辑

基于指令的3D场景编辑神经辐射场技术

tetra-nerf

tetra-nerf

Tetra-NeRF神经辐射场

四面体表示法提升神经辐射场渲染效率

3DModelingRL

3DModelingRL

3D建模强化学习

深度强化学习在3D建模中的应用与突破

KinD_plus

KinD_plus

KinD++低光照图像增强

创新低光照图像增强技术

night-enhancement

night-enhancement

夜间图像增强无监督学习

将层分解与光效抑制结合的无监督夜间图像增强方法

NATTEN

NATTEN

NATTENNeighborhood Attention

高效实现多维滑动窗口自注意力的开源库

End-to-end-Autonomous-Driving

End-to-end-Autonomous-Driving

自动驾驶端到端

端到端自动驾驶研究资源综合集成

Gaussian-SLAM

Gaussian-SLAM

Gaussian-SLAMSLAM

革新性实时3D重建技术,融合高斯散射实现逼真效果

yolov8-face

yolov8-face

YOLOv8人脸检测

YOLOv8优化的实时人脸检测与关键点定位框架

hagrid

hagrid

HaGRID手势识别

大规模手势识别图像数据集助力人机交互系统开发

WinClip

WinClip

WinCLIP异常检测

先进的零样本和少样本异常检测算法

MAD

MAD

MAD数据集视频语言定位

大规模电影音频数据集用于视频语言定位研究

VisionLLM

VisionLLM

VisionLLM多模态大语言模型

面向视觉任务的开放式多模态大语言模型

yolov9-face-detection

yolov9-face-detection

YOLOv9人脸检测

YOLOv9在WIDER Face数据集上的人脸检测实现

awesome-machine-learning

awesome-machine-learning

机器学习深度学习

机器学习框架与资源汇总 多语言开源项目集锦

SportsLabKit

SportsLabKit

SportsLabKit体育分析

专业体育分析工具包 实现比赛视频数据化

SMPLer-X

SMPLer-X

SMPLer-X人体姿态估计

基于ViT的高效人体3D重建框架