
词典指导场景文字识别方法及VinText数据集

基于编码模糊核空间的图像去模糊新方法

高效准确的3D点云实例分割网络实现先进场景理解

相机与激光雷达自动校准优化工具

视觉语言基础模型精选资源库

统一12种模态的多模态学习框架

扩散模型数据复制研究与优化方法分析

基于下一标记预测的创新物体识别技术

免COLMAP的3D高斯散射场景重建技术

基于迭代混合注意力的端到端目标跟踪框架

基于长期记忆的Transformer多目标跟踪方法

双向相机LiDAR融合实现光流和场景流联合估计

多功能时序动作检测工具箱支持多数据集和前沿方法

多模态视频特征提取框架 支持多种深度学习模型

激活更多像素的图像超分辨率转换器

长视频理解研究前沿进展与资源综述

基于SAM2框架的2D和3D医学图像精准分割模型

多场景计算机视觉模型在线测试时适应框架

全面收录文本到图像生成与编辑技术资源

统一视觉参数高效迁移学习评测基准
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号