基于Transformer的高分辨率长视频生成框架
创新的场景文本识别统一模型
PyTorch实现的NeRF算法集合
区域感知神经辐射场技术实现高保真说话人物肖像合成
基于层次化方法的图像矢量化技术
Segment Anything技术在3D场景中的创新应用
自回归Transformer实现的3D网格生成技术
全面高效的3D全景数据标注工具箱
Transformers库深度学习模型教程集合
高效轻量化图像分割模型,适用于移动设备
实时视频会议的逼真数字化身技术
开源AI代理库用于生成计算机视觉代码
MediaPipe任务的Rust库 为WasmEdge WASI-NN提供支持
扩散模型驱动的机器人控制算法实现复杂任务执行
多任务人体运动表征学习框架
用于训练多任务深度神经网络的工具库
像素、图像和语言的统一解码模型
聚焦计算机视觉在野外(Computer Vision in the Wild)这一新兴研究领域
开放式条件引导的文本到图像生成模型
实时高分辨率背景抠图技术的创新突破
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号