Meta 最新发布的 Audio2PhotoReal 项目能够生成由语音驱动的逼真人物化身,为元宇宙交互体验带来重大突破。
DINOv2是一种由Meta AI研发的自监督视觉Transformer模型,能够在不使用任何标签的情况下学习到强大的视觉特征表示,在多种计算机视觉任务中展现出优异的性能。