bpycv是一个强大的Python库,为3D建模软件Blender提供了丰富的计算机视觉和深度学习功能。它可以让研究人员和开发者轻松地使用Blender生成高质量的合成数据集,用于训练和测试计算机视觉算法。
bpycv具有以下核心功能:
bpycv支持Blender 2.9、3.0和3.1+版本。安装步骤如下:
从Blender官网下载并安装Blender。
在终端中打开Blender目录,运行以下安装脚本:
# 确保pip已安装 ./blender -b --python-expr "from subprocess import sys,call;call([sys.executable,'-m','ensurepip'])" # 更新pip工具链 ./blender -b --python-expr "from subprocess import sys,call;call([sys.executable]+'-m pip install -U pip setuptools wheel'.split())" # 安装bpycv ./blender -b --python-expr "from subprocess import sys,call;call([sys.executable]+'-m pip install -U bpycv'.split())" # 检查bpycv是否安装成功 ./blender -b -E CYCLES --python-expr "import bpycv,cv2;d=bpycv.render_data();bpycv.tree(d);cv2.imwrite('/tmp/try_bpycv_vis(inst-rgb-depth).jpg', d.vis()[...,::-1])"
以下是一个快速的实例分割和深度图生成示例:
import cv2 import bpy import bpycv import random import numpy as np # 移除所有MESH对象 [bpy.data.objects.remove(obj) for obj in bpy.data.objects if obj.type == "MESH"] for index in range(1, 20): # 在随机位置创建立方体和球体作为实例 location = [random.uniform(-2, 2) for _ in range(3)] if index % 2: bpy.ops.mesh.primitive_cube_add(size=0.5, location=location) categories_id = 1 else: bpy.ops.mesh.primitive_uv_sphere_add(radius=0.5, location=location) categories_id = 2 obj = bpy.context.active_object # 为每个实例设置唯一的inst_id,用于生成实例标注 obj["inst_id"] = categories_id * 1000 + index # 一行代码渲染图像、实例标注和深度图 result = bpycv.render_data() # 保存结果 cv2.imwrite("demo-rgb.jpg", result["image"][..., ::-1]) # 转换RGB图像为OpenCV的BGR格式 cv2.imwrite("demo-inst.png", np.uint16(result["inst"])) # 保存实例图为16位PNG depth_in_mm = result["depth"] * 1000 # 将深度单位从米转换为毫米 cv2.imwrite("demo-depth.png", np.uint16(depth_in_mm)) # 保存为16位PNG # 为人类可视化实例掩码、RGB图像和深度图 cv2.imwrite("demo-vis(inst_rgb_depth).jpg", result.vis()[..., ::-1])
运行上述代码后,打开demo-vis(inst_rgb_depth).jpg
文件,可以看到生成的实例分割、RGB图像和深度图的可视化结果。
bpycv还提供了基于YCB数据集的更复杂演示。以下是运行步骤:
mkdir ycb_demo cd ycb_demo/ # 准备代码和示例数据 git clone https://github.com/DIYer22/bpycv git clone https://github.com/DIYer22/bpycv_example_data cd bpycv/example/ blender -b -P ycb_demo.py cd dataset/vis/ ls . # 查看可视化结果
打开ycb_demo/bpycv/example/dataset/vis/0.jpg
可以看到生成的结果:
这个YCB演示包括:
bpycv还提供了生成和可视化6自由度姿态真实标注数据的演示。详细代码可以查看example/6d_pose_demo.py。
Blender可能无法直接加载YCB和ShapeNet数据集中的.obj
或.dae
文件。建议使用meshlabserver
进行转换和格式化,命令如下:
meshlabserver -i raw.obj -o for_blender.obj -m wt
bpycv项目欢迎任何建议和贡献。如果你在使用过程中遇到问题或有改进意见,可以在GitHub Issues中提出。
总的来说,bpycv为计算机视觉研究人员和开发者提供了一个强大而灵活的工具,可以轻松地使用Blender生成高质量的合成数据集。无论是实例分割、语义分割、深度估计还是6D姿态估计,bpycv都能满足各种计算机视觉任务的数据需求。它的简单安装过程和丰富的示例 代码,使得即使是Blender新手也能快速上手并开始生成自己的数据集。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。