S3Gaussian

项目介绍：S3Gaussian

S3Gaussian，全称为“Self-Supervised Street Gaussians for Autonomous Driving”，是一个专注于自动驾驶领域的平台。这个项目的目标是通过使用3D高斯分布来模拟动态场景，而无需依赖其他监督信息（例如，3D边界框）。该项目由一组优秀的研究人员在加州大学伯克利分校开发，项目的领导者是Wenzhao Zheng。

项目背景与意义

在自动驾驶领域，如何精确地分解街道场景一直是一个巨大的挑战。传统的方法通常依赖于大量标注数据，这在实际操作中成本非常高。因此，S3Gaussian 通过自监督的方式来解决这个问题，能够在不使用额外标注的情况下，有效地实现场景分解和渲染。

技术框架

多分辨率Hexplane编码器

为了实现自监督的街道场景分解，S3Gaussian 提出了一个创新的多分辨率Hexplane编码器。这个编码器能够将4D网格编码成特征平面，从而更有效率地处理复杂动态场景。

多头高斯解码器

编码完成后，系统通过多头高斯解码器将这些特征平面解码为变形的4D高斯分布。这种方法增强了系统在自监督环境下的场景分解能力和渲染质量。

操作指南

环境搭建

S3Gaussian 的代码在Ubuntu 22.04系统上开发，使用的Python版本为3.9，并基于Pytorch的多个版本进行测试。推荐使用Conda来安装依赖项，以保证环境的兼容性。

git clone https://github.com/nnanhuang/S3Gaussian.git --recursive
cd S3Gaussian
conda create -n S3Gaussian python=3.9 
conda activate S3Gaussian

pip install -r requirements.txt
pip install -e submodules/depth-diff-gaussian-rasterization
pip install -e submodules/simple-knn

数据准备与训练

在进行数据操作时，只需要使用动态和静态数据的分割。在训练模型时，可以通过一系列的命令来指定数据路径、端口号以及模型保存路径等参数，以完成数据输入、模型训练以及评估。

模型评估与可视化

模型评估与可视化是项目的重要组成部分，通过特定的脚本，可以生成渲染RGB视频、实际RGB视频、深度视频以及动态和静态的RGB视频。

项目贡献与鸣谢

S3Gaussian 得到了来自多个开源项目的启发和支持，其中包括StreetGaussians和EmerNeRF等。项目组成部分归功于Korace0v0为街道场景建设3D高斯模型所做出的贡献。

引用格式

如果您在研究或开发中使用到了_S3Gaussian_ 项目的资源，请记得引用相关论文，以表感谢：

@article{huang2024s3gaussian,
        title={S3Gaussian: Self-Supervised Street Gaussians for Autonomous Driving},
        author={Huang, Nan and Wei, Xiaobao and Zheng, Wenzhao and An, Pengju and Lu, Ming and Zhan, Wei and Tomizuka,    Masayoshi and Keutzer, Kurt and Zhang, Shanghang},
        journal={arXiv preprint arXiv:2405.20323},
        year={2024}
      }

这个项目的开发旨在推动自动驾驶技术进步，减少对标注数据的依赖，从而提高技术应用的可行性和经济性。