GPTEval3D

GPTEval3D

基于GPT-4V的文本到3D生成模型评估框架

GPTEval3D是一个实现了《GPT-4V(ision) is a Human-Aligned Evaluator for Text-to-3D Generation》论文评估指标的开源项目。该框架提供了完整的文本到3D生成模型评估流程,包括数据准备、模型评估和比赛评分。研究者可以利用GPTEval3D评估自己的模型或组织3D生成模型比赛。项目还包含110个精选图像提示和详细的使用说明,方便研究人员快速上手。

GPTEval3D

《GPT-4V(ision)是一个适合人类的文本到3D生成评估器》论文的实现。 这包含了一个用于评估文本到3D生成模型的评估指标。

预览图

新闻

  • 我们发布了110个与文本提示相对应的图像提示。每张图像都经过精心挑选以与文本保持一致。我们进一步使用rembgClipdrop移除了背景。可以在此链接下载图库。

安装

此代码库的主要依赖是OpenAI库和PyTorch。 对于PyTorch的安装,请参考官方网站,因为它高度依赖于环境。 以下是安装其他包的代码:

# 安装OpenAI API pip install --upgrade openai # 其他包 pip install --upgrade tqdm numpy Pillow gdown

评估您的文本到3D模型

步骤1. 数据下载

有关数据格式的详细说明,请参阅此文档

# 测试数据 # 13种方法;110个提示;每个方法120个均匀的RGB和法线图渲染。 # Google Drive: https://drive.google.com/file/d/1pYmSRu_oMy_v6f7ngnkFER6PNWmJAe52/view?usp=sharing cd data/tournament-v0 gdown "https://drive.google.com/uc?id=1pYmSRu_oMy_v6f7ngnkFER6PNWmJAe52" unzip methods

步骤2. 准备数据

请在比赛文件夹下找到prompts.json文件(例如data/tournament-v0/prompts.json)。 对于其中列出的每个提示,使用您的文本到3D生成模型为每个提示创建一个或多个形状。 对于每个形状,请使用Threestudio代码库选择的相机角度渲染120个均匀分布的视图。 对于每个渲染,请尝试创建512x512分辨率。 对于每个RGB渲染,还请创建其对应的表面法线渲染。 这些渲染将提供给GPT-4V。 最后,将渲染的图像组织成以下文件夹结构:

- data/<您的方法名称>/ # 从零开始的提示 - <prompt-id-1>/ -<seed1> rgb_001.png ... rgb_119.png normal_001.png ... normal_119.png ...

步骤3. 运行评估

一旦我们将数据放入评估可以解析的格式中,我们可以运行以下命令来获取ELO分数,将您的方法置于现有比赛中。

python gpt_eval_alpha.py \ --apikey <您的openai_api密钥> \ --eval new_method \ # 评估新方法 -t data/t23d-tournament-v0 \ # 比赛数据文件夹 -m data/<您的方法名称> \ # 方法文件夹 -o results/<您的方法名称> # (可选)输出目录

计算比赛分数

步骤1:组织数据

请按以下结构组织一组文本到3D生成模型。

<根目录> config.json prompts.json methods/ <方法名称-1> <prompt-id-1> <seed-1> rgb_0.png ... normal_0.png ... ... <seed-k> ... <prompt-id-m> ... <方法名称-n>

有关应该放入config.jsonprompts.json的更多信息, 请参见此链接

步骤2:运行评估

python gpt_eval_alpha.py \ --apikey <您的openai_api密钥> \ --eval tournament \ # 评估新方法 -t <比赛数据路径> \ # 比赛数据文件夹 -b 200 \ # 预算(请求次数) -o results/<比赛名称> # (可选)输出目录

即将推出

  • 更多可视化和实用工具!
  • 文本到3D排行榜

引用

如果您发现我们的代码库对您的研究有用,请引用:

@inproceedings{wu2023gpteval3d, author = {Tong Wu and Guandao Yang and Zhibing Li and Kai Zhang and Ziwei Liu and Leonidas Guibas and Dahua Lin and Gordon Wetzstein}, title = {GPT-4V(ision) is a Human-Aligned Evaluator for Text-to-3D Generation}, booktitle = {CVPR}, year = {2024}, } }

致谢

我们真诚地感谢以下项目,包括GPT-4Vthreestudiomvdreamprolificdreamerfantasia3dpoint-eshap-edreamgaussianwonder3dsyncdreamer提供的优秀代码库!

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多