
基于Transformer的高分辨率长视频生成框架

创新的场景文本识别统一模型

PyTorch实现的NeRF算法集合

区域感知神经辐射场技术实现高保真说话人物肖像合成

基于层次化方法的图像矢量化技术

Segment Anything技术在3D场景中的创新应用

自回归Transformer实现的3D网格生成技术

全面高效的3D全景数据标注工具箱

Transformers库深度学习模型教程集合

高效轻量化图像分割模型,适用于移动设备

实时视频会议的逼真数字化身技术

开源AI代理库用于生成计算机视觉代码

MediaPipe任务的Rust库 为WasmEdge WASI-NN提供支持

扩散模型驱动的机器人控制算法实现复杂任务执行

多任务人体运动表征学习框架

用于训练多任务深度神经网络的工具库

像素、图像和语言的统一解码模型

聚焦计算机视觉在野外(Computer Vision in the Wild)这一新兴研究领域

开放式条件引导的文本到图像生成模型

实时高分辨率背景抠图技术的创新突破
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号