
MS-Diffusion是一个创新的深度学习框架,通过布局引导实现多主体零样本图像个性化生成。它解决了文本到图像生成中的细节保真度和多主体一致性问题,为个性化文本到图像生成开辟了新的方向。

InstanceDiffusion为文本到图像的扩散模型增加了精确的实例级控制能力,支持自由形式的语言条件和灵活的实例位置指定方式,如单点、涂鸦、边界框或复杂的实例分割掩码等,显著提升了图像生成的可控性和质量。

PyDIff是一个基于金字塔扩散模型的低光照图像增强方法,在IJCAI 2023会议上获得口头报告。该方法在LOL数据集上取得了最先进的性能,为低光照图像处理领域带来了新的突破。

探索如何通过使用4位优化器状态来提高神经网络训练的内存效率,同时保持模型性能。这项创新技术在多个领域的基准测试中展现出与全精度对应物相当的准确性,为大规模模型训练开辟了新的可能性。

本文介绍了一种新的方法来解决图像到视频扩散模型中的条件图像泄露问题,通过推理和训练策略的改进显著提升了生成视频的动态性和逼真度。

ARES是一个专注于评估图像分类和目标检测模型对抗性鲁棒性的Python库,提供了多种攻击方法、防御机制和分布式训练/测试功能。

本文深入介绍了微软开源的Promptbase项目,这是一个专注于提示工程的资源库。文章详细阐述了项目的主要组成部分、核心技术Medprompt及其扩展版Medprompt+,以及项目在多项基准测试中的出色表现。同时探讨了Promptbase对人工智能领域,特别是在提升大型语言模型性能方面的重要意义。

本文深入探讨了无代码/低代码开发的概念、优势及其在各个领域的应用,为读者全面介绍了这一正在改变软件开发格局的新趋势。

PrivateGPT是一个创新的开源项目,旨在提供完全本地化和私密的ChatGPT式体验,让用户能够在保护隐私的同时利用大语言模型的强大功能。