meshgpt-pytorch

MeshGPT - Pytorch

在Pytorch中实现<a href="https://arxiv.org/abs/2311.15475">MeshGPT</a>，使用注意力机制的最先进网格生成技术

还将添加文本条件，以实现最终的文本到3D资产转换

如果您有兴趣与他人合作复现这项工作，请加入<a href="https://discord.gg/xBPBXfcFHd"><img alt="加入我们的Discord" src="https://img.shields.io/discord/823813159592001537?color=5865F2&logo=discord&logoColor=white"></a>

更新：<a href="https://github.com/MarcusLoppe">Marcus</a>已经训练并上传了<a href="https://huggingface.co/MarcusLoren/MeshGPT-preview">一个可用模型</a>到🤗 Huggingface！

致谢

感谢<a href="https://stability.ai/">StabilityAI</a>、<a href="https://a16z.com/supporting-the-open-source-ai-community/">A16Z开源AI资助计划</a>和<a href="https://huggingface.co/">🤗 Huggingface</a>的慷慨赞助，以及我的其他赞助者，让我能够独立开源当前的人工智能研究
感谢<a href="https://github.com/arogozhnikov/einops">Einops</a>让我的工作变得轻松
感谢<a href="https://github.com/MarcusLoppe">Marcus</a>进行初步代码审查（指出一些缺失的派生特征）以及运行首次成功的端到端实验
感谢<a href="https://github.com/MarcusLoppe">Marcus</a><a href="https://github.com/lucidrains/meshgpt-pytorch/issues/18#issuecomment-1859214710">首次成功训练</a>了一组基于标签条件的形状集合
感谢<a href="https://github.com/qixuema">Quexi Ma</a>发现了自动eos处理的多个错误
感谢<a href="https://github.com/thuliu-yt16">Yingtian</a>发现了空间标签平滑的位置高斯模糊中的一个错误
再次感谢<a href="https://github.com/MarcusLoppe">Marcus</a>进行实验验证，证明可以将系统从三角形扩展到<a href="https://github.com/lucidrains/meshgpt-pytorch/issues/54#issuecomment-1906789076">四边形</a>
感谢<a href="https://github.com/MarcusLoppe">Marcus</a>识别出<a href="https://github.com/lucidrains/meshgpt-pytorch/issues/80">文本条件的一个问题</a>，并进行了所有导致问题解决的实验

安装

$ pip install meshgpt-pytorch

使用方法

import torch

from meshgpt_pytorch import (
    MeshAutoencoder,
    MeshTransformer
)

# 自动编码器

autoencoder = MeshAutoencoder(
    num_discrete_coors = 128
)

# 模拟输入

vertices = torch.randn((2, 121, 3))            # (批次, 顶点数, 坐标 (3))
faces = torch.randint(0, 121, (2, 64, 3))      # (批次, 面数, 顶点 (3))

# 确保对于可变长度的网格，faces用"-1"填充

# 前向传播faces

loss = autoencoder(
    vertices = vertices,
    faces = faces
)

loss.backward()

# 经过大量训练后...
# 您可以将上面的原始face数据传入transformer，以建模这个面顶点序列

transformer = MeshTransformer(
    autoencoder,
    dim = 512,
    max_seq_len = 768
)

loss = transformer(
    vertices = vertices,
    faces = faces
)

loss.backward()

# 在transformer经过大量训练后，您现在可以采样生成新的3D资产

faces_coordinates, face_mask = transformer.generate()

# (批次, 面数, 顶点 (3), 坐标 (3)), (批次, 面数)
# 现在对生成的3D资产进行后处理

对于<a href="https://www.youtube.com/watch?v=NXX0dKw4SjI">基于文本条件的3D形状合成</a>，只需在您的MeshTransformer上设置condition_on_text = True，然后将您的描述列表作为texts关键字参数传入

例如：

transformer = MeshTransformer(
    autoencoder,
    dim = 512,
    max_seq_len = 768,
    condition_on_text = True
)


loss = transformer(
    vertices = vertices,
    faces = faces,
    texts = ['一把高脚椅', '一个小茶壶'],
)

loss.backward()

# 在transformer经过大量训练后，您现在可以基于文本条件采样生成新的3D资产

faces_coordinates, face_mask = transformer.generate(
    texts = ['一张长桌'],
    cond_scale = 3.  # cond_scale > 1. 将启用无分类器引导 - 可以设置在3. - 10.之间的任何值
)

如果您想对网格进行标记化，以便在多模态transformer中使用，只需在自动编码器上调用.tokenize方法（或在自动编码器训练器实例上使用相同的方法来获取指数平滑模型）


mesh_token_ids = autoencoder.tokenize(
    vertices = vertices,
    faces = faces
)

# (批次, 面顶点数, 残差量化层)

类型检查

在项目根目录下运行

$ cp .env.sample .env

待办事项

引用

[引用内容保持不变]

MeshGPT - Pytorch

致谢

安装

使用方法

类型检查

待办事项

引用

编辑推荐精选

扣子-AI办公

堆友

码上飞

Vora

Refly.AI

酷表ChatExcel

TRAE编程

AIWritePaper论文写作

博思AIPPT

潮际好麦

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号