本文详细介绍了台湾大学李宏毅教授2021年机器学习课程的核心内容,涵盖了从基础概念到前沿技术的多个主题,为学习者提供了全面而深入的机器学习知识体系。
本文全面梳理了人类视频生成领域的最新研究进展,介绍了从早期的基于GAN的方法到最新的基于NeRF的方法,探讨了该技术在数字人、虚拟主播等领域的应用前景,并对未来发展趋势进行了展望。
NeuralSVB是一种新型的神经网络模型,旨在提高业余歌手的歌声质量,同时保留原有的内容和音色特征。该技术在ACL 2022会议上发表,代表了歌声美化研究的最新进展。
AttGAN-Tensorflow是一个强大的人脸属性编辑模型,能够精确地只改变用户指定的属性,同 时保持其他细节不变。本文详细介绍了AttGAN的原理、实现和使用方法。
PSGAN是一种创新的深度学习模型,可以在不同姿态和表情下实现高质量的妆容迁移。它结合了空间感知和对抗学习技术,能够生成自然逼真的妆容效果,并支持自定义调整。本文将详细介绍PSGAN的原理、特点及应用。
探索一种创新的无监督生成对抗网络 EnlightenGAN,它能够在没有配对低光/正常光照图像的情况下进行训练,并在各种真实世界的测试图像上表现出色。本文详细介绍了 EnlightenGAN 的原理、创新点和应用,展示了其在低光照图像增强领域的突破性进展。
EEG-ATCNet是一种创新的深度学习模型,结合了注意力机制和时间卷积网络,专门用于脑电图(EEG)运动想象(MI)信号的分类。该模型在BCI竞赛IV-2a数据集上实现了最先进的性能,为脑-机接口系统的发展提供了新的思路。
一个汇集了大量免费机器学习相关学习资源的资料库,包括数学基础、机器学习、深度学习、强化学习等多个领域的书籍、课程和论文。
探索Alireza-Akhavan的深度学习项目,通过丰富的Jupyter notebooks学习TensorFlow 2和Keras的实际应用。
本文介绍了ViTAE-Transformer团队在遥感领域的一系列创新研究成果,包括SAMRS、RVSA和RSP等多个重要项目,展示了他们如何利用深度学习技术推动遥感图像分析的进步。
本文介绍了一种名为CoDA的新方法,用于解决开放词汇3D目标检测中的挑战。CoDA通过协作式新颖框发现和跨模态对齐,实现了对未见类别的高效检测。
YOLO-Patch-Based-Inference是一个Python库,通过分块推理的方式来增强YOLOv8和YOLOv9等模型对小目标的检测和分割能力。该库提供了简单易用的API,支持多种YOLO模型,并能自动优化参数以达到最佳性能。
EQTransformer是一个基于深度神经网络和注意力机制的人工智能地震信号检测和P、S相位拾取模型。它具有专门为地震信号设计的分层架构,在全球地震数据上进行了训练,可以同时高效地执行检测和到时拾取。除了预测概率外,它还可以提供模型不确定性估计。
nnDetection是一个用于3D医学图像目标检测的自配置框架,无需手动干预即可应用于新的数据集。本文介绍了nnDetection的设计理念、主要功能和使用方法,展示了其在多个医学影像数据集上的优异表现。
随着中国政府批准首批人工智能聊天机器人公开发布,百度等科技巨头正在积极开发具有情感支持功能的AI助手,引领中国聊天机器人市场的新趋势。
本文详细介绍了如何使用 PyTorch 框架在 MNIST 手写数字数据集上实现 LeNet-5 卷积神经网络模型,包括数据准备、模型构建、训练过程以及结果分析等关键步骤。
本文介绍了一种基于序列到序列深度学习模型的ECG心跳分类方法,用于检测心律失常。该方法能够进行病人内和病人间的心跳分类,取得了良好的分类效果。
QATM_pytorch是QATM(Quality-Aware Template Matching)算法的PyTorch非官方实现,提供了一种新的质量感知模板匹配方法,可用于多种计算机视觉任务。
本文介绍了一种名为NeurVPS的端到端可训练深度网络,该网络利用几何启发的卷积算子来检测图像中的消失点。NeurVPS结合了数据驱动方法和几何先验的优势,在消失点检测任务上取得了优于现有最先进方法的性能。
DeepCrack是一种基于深度学习的裂缝检测方法,通过学习多尺度卷积特征来实现高精度的裂缝分割。本文介绍了DeepCrack的网络结构、数据集、训练方法和实验结果,展示了其在多个具有挑战性的裂缝数据集上的优秀性能。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号