
基于transformer的通用机器人控制策略

实用机器学习库助力实际机器人开发

千万级中文视频语言数据集及多模态基准

NLP论文学习和实战资源库

多语言文本和图像嵌入向量生成框架

视觉资产和AI模型资源库

基于PyTorch的神经网络图像分割库

综合性开源语音识别与处理工具集

音频与文本的对比学习预训练模型

双向等变长程DNA序列建模的创新方法

单目深度估计新突破,高精度与快速推理并重

微软自然语言生成研究项目概述

多语言音素表示模型助力TTS性能提升

基于音频编解码器的先进音乐生成模型

先进的多语言文本转语音库 支持1100多种语言

兼顾效率与经济性的大规模混合专家语言模型

开源多模态说话人识别与验证工具包

深度神经网络,从发票文档中提取智能信息

推荐用于快速生成3D纹理网格的前馈模型

多任务优化的跨模态序列到序列预训练模型
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号