在这个<a href="https://www.youtube.com/watch?v=AJGSa_wnZS8&ab_channel=FlorianBarthel">视频</a>中查看一些编辑示例。
最新更新: splatviz现在支持实时跟踪正在运行的3DGS训练:<a href="https://www.youtube.com/watch?v=lnMB83wnfvE">视频</a>。
</div> <div align="center"> <img src="https://yellow-cdn.veclightyear.com/835a84d5/50e2e441-f3ff-4367-aa8e-cd020d3cd630.png" width="650"> </div></td> </tr> <tr></tr> <tr> <th> 2. 安装 </th> <td> 使用<b>conda</b>创建conda环境:git clone https://github.com/Florian-Barthel/splatviz.git --recursive
</td> <td> 或者,使用<b>micromamba</b>创建环境:conda env create \ -f environment.yml conda activate gs-view
</td> </tr> </table>micromamba env create \ --file environment.yml \ --channel-priority flexible -y micromamba activate gs-view
python run_main.py
或指定包含.ply或.yml文件的路径启动:
</td> </tr> <tr></tr> <tr> <td>附加到训练</td> <td>附加模式允许您查看和编辑正在运行的3DGS训练。这适用于3DGS的默认实现。要在训练期间编辑场景并查看一些额外信息,请按照<a href="splatviz_network/README.md">此处</a>描述的简单步骤操作。</td> <td>python run_main.py --data_path=path/with/ply/files
</td> </tr> <tr></tr> <tr> <td>解码器模式</td> <td>解码器模式渲染由3D GANs生成的人头,来自<a href="https://github.com/fraunhoferhhi/gaussian_gan_decoder/blob/main/README.md">这篇论文</a>。</td> <td>python run_main.py --mode=attach
</td> </tr> </table>python run_main.py \ --mode=decoder \ --data_path=path/with/pkl/files \ --ggd_path=path/to/gaussian_gan_decoder/project
运行run_main.py
文件后,查看器将直接加载在指定数据目录中找到的第一个场景。您可以通过点击浏览按钮更改场景。您将看到可用的_.ply_文件(或对应于使用<a href="https://fraunhoferhhi.github.io/Self-Organizing-Gaussians/">此</a>压缩方法的压缩高斯场景的_.yml_文件)列表。如果您有很多场景可供选择,还可以使用过滤器文本字段提供逗号分隔的关键词(例如_lego,30000,baseline_)。然后您将只看到包含所有关键词的场景。
此外,您还可以同时查看多个3D场景。只需点击添加场景,它会加载与之前相同的场景,然后使用新的浏览按钮将相应的场景更改为另一个.ply文件。场景可以并排渲染,或在激活分屏复选框时以分屏模式渲染。
您可以在这里下载一些示例场景。它们是使用来自https://fraunhoferhhi.github.io/Self-Organizing-Gaussians 的高斯溅射压缩方法创建的。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/6d51d425-d619-4db4-a9e3-d28003cc5925.png"> </details> <details close> <summary><h3>🛠️ 编辑小部件</h3></summary>编辑小部件是这个3D查看器的核心功能。它允许在运行时实时编辑高斯Python对象。您在此文本区域中输入的代码将在高斯对象被转发到cuda渲染器之前执行。这意味着,编辑能力是无限的。只要提供的代码可执行,您可以输入任何类型的Python代码,还可以导入新库。一个例子可能如下所示,其中所有尺度都设置为-8(在用_exp()_激活之前),所有不透明度值都设置为10(在用_sigmoid()_激活之前),同时背景设置为1,对应白色。
gaussian._scaling = gaussian._scaling * 0 - 8 gaussian._opacity = gaussian._opacity * 0 + 10 self.bg_color[:] = 1
为了实现平滑的编辑过渡,您可以创建滑块(按添加滑块),可以在编辑器文本中通过输入slider.name(例如slider.x)访问这些滑块。一个例子可能如下所示。在这里,我们创建一个布尔掩码,过滤掉所有小于存储在slider.x中的值的高斯。
mask = torch.linalg.norm(gaussian._scaling, dim=-1) < slider.x gaussian._xyz = gaussian._xyz[mask] gaussian._rotation = gaussian._rotation[mask] gaussian._scaling = gaussian._scaling[mask] gaussian._opacity = gaussian._opacity[mask] gaussian._features_dc = gaussian._features_dc[mask] gaussian._features_rest = gaussian._features_rest[mask]
最后,您可以保存和加载代码片段的预设,这样在关闭应用程序后就不必再次输入相同的代码。这些预设存储在.json文件(presets.json)中。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/78f7ae90-b392-4ee0-8854-60138efc09e5.png"> </details> <details close> <summary><h3>🔍 评估小部件</h3></summary>评估小部件可用于调试高斯溅射对象。通过输入在渲染后执行的Python代码,您可以访问渲染上下文中的任何变量并在直方图中可视化它们。一些有用的变量可能是:
您还可以访问在编辑小部件的编辑器中定义的变量。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/4611cb97-ab43-4add-8280-356443817c63.png"> </details> <details close> <summary><h3>🎥 相机小部件</h3></summary>在相机小部件中,您可以定义相机的类型和参数。最重要的是,您可以在轨道和WASD两种模式之间选择。
在轨道模式下,相机注视3D空间中的特定点,您可以通过在渲染视图上用鼠标拖动来控制相机在围绕该点的球面上旋转的俯仰角和偏航角。
在WASD模式下,您可以使用鼠标和WASD键通过场景飞行,类似于Unity中的相机控制。
重要提示:如果加载的场景旋转不正确,您可以通过操纵相机使其直接向上或向下看来调整。然后通过按设置当前方向将上向量设置为当前视图方向。如果您之前是向下看的,您需要按翻转按钮,因为场景现在是倒置的。 <img src="https://yellow-cdn.veclightyear.com/835a84d5/3c67f3eb-cd1d-4a4c-906b-f5b65e270ee6.png">
</details> <details close> <summary><h3>🎞️ 视频小部件</h3></summary>视频小部件可以创建当前对象完整旋转的视频序列。 只需定义相机高度和渲染分辨率即可。在视频渲染过程中,用户界面将被冻结。终端输出中会显示一个加载屏幕。
🚧此功能仍在建设中🚧。目前生成视频的方式不太直观,因为相机位置仅由<b>相机高度</b>参数定义。这将在未来进行改进。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/097faf30-73c9-4638-8c8a-206ec2d02bbb.png"> </details> <details close> <summary><h3>📈 性能小部件</h3></summary> 在性能小部件中,你可以跟踪查看器的FPS和渲染器的FPS。你还可以为FPS指定限制并启用垂直同步。未来还将提供性能模式,跳过一些编辑和评估计算。 <img src="https://yellow-cdn.veclightyear.com/835a84d5/3e68e717-414f-4554-b478-0162691b7a8d.png"> </details> <details close> <summary><h3>🖥️ 渲染小部件</h3></summary>在渲染选项卡中,你可以指定渲染分辨率(目前仅支持方形分辨率)和渲染模式。 除了RGB,你还可以渲染图像的3D深度和alpha值。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/f7bf27ef-6762-4538-a3c3-b989a1caf6f1.png"> </details> <details close> <summary><h3>💾 保存小部件</h3></summary>要保存.ply文件或当前(编辑后)3D场景的渲染,请按保存小部件中的相应按钮。这些文件将保存在_screenshots或_ply_files下。保存ply文件后,查看器可能会短暂冻结。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/cd6f37c0-a389-4a81-9e64-a1b8d531cdd3.png"> </details> </div>版本1.1.0
版本1.0.0
欢迎你为这个交互式查看器添加更多功能或更好的设计! 主要目标是创建一个易于使用的工具,可用于调试和理解3D高斯散射对象。 请使用black进行代码格式化,并设置--line-length 120。
如果你发现这个查看器有用,请考虑引用我们的工作:
@misc{barthel2024gaussian,
title={Gaussian Splatting Decoder for 3D-aware Generative Adversarial Networks},
author={Florian Barthel and Arian Beckmann and Wieland Morgenstern and Anna Hilsmann and Peter Eisert},
year={2024},
eprint={2404.10625},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
这个查看器的灵感来自Efficient Geometry-aware 3D Generative Adversarial Networks (EG3D)的可视化工具。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
全能AI智能助手,随时解答生活与工作的多样问题
问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。
实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号