零样本学习资源大全:工具、网站、APP与开源项目

GenerSpeech入门学习资料 - 高保真零样本风格迁移TTS模型

GenerSpeech入门学习资料 - 高保真零样本风格迁移TTS模型

GenerSpeech是一个用于域外自定义语音高保真零样本风格迁移的文本转语音模型。本文汇总了GenerSpeech的相关学习资源,包括项目介绍、代码实现、演示样例等,帮助读者快速了解和上手这一前沿TTS技术。

GenerSpeech文本到语音风格转换零样本学习多GPU支持Github开源项目
open_clip学习资料汇总 - 开源CLIP实现

open_clip学习资料汇总 - 开源CLIP实现

open_clip是OpenAI CLIP(对比语言-图像预训练)模型的开源实现,本文汇总了该项目的主要学习资源,帮助读者快速入门和深入学习。

OpenCLIP预训练模型对比学习图像识别零样本学习Github开源项目
FRESCO:一种革命性的零样本视频翻译技术

FRESCO:一种革命性的零样本视频翻译技术

FRESCO是一种新型的零样本视频翻译方法,通过引入空间-时间对应约束来实现高质量、连贯的视频风格转换。本文详细介绍了FRESCO的工作原理、主要特点以及应用示例。

FRESCO视频转换零样本学习时空对应稳定扩散Github开源项目
OpenGraph协议:让网页成为丰富的社交图谱对象

OpenGraph协议:让网页成为丰富的社交图谱对象

OpenGraph协议是一种让任何网页都能成为社交图谱中丰富对象的开放标准。本文深入介绍了OpenGraph的原理、实现方法和应用场景,帮助开发者更好地利用这一强大工具优化网站的社交分享体验。

OpenGraph图神经网络零样本学习大语言模型图生成Github开源项目
UniTS: 构建统一时间序列模型的突破性研究

UniTS: 构建统一时间序列模型的突破性研究

UniTS是一个革命性的统一时间序列模型,能够处理跨多个领域的各种任务,具有共享参数和无任务特定模块的特点。本文深入探讨了UniTS的创新设计、强大功能和广泛应用前景。

UniTS时间序列模型多任务学习迁移学习零样本学习Github开源项目
WinCLIP: 零样本/少样本异常分类和分割的创新方法

WinCLIP: 零样本/少样本异常分类和分割的创新方法

WinCLIP是一种基于CLIP模型的创新方法,旨在解决工业质量检测中的零样本和少样本异常分类与分割问题。它通过窗口化CLIP和特征对齐等技术,显著提高了模型在无监督和少样本场景下的性能,为自动化质量检测提供了新的解决方案。

WinCLIP异常检测计算机视觉零样本学习少样本学习Github开源项目
GLIP: 突破性的图像-语言预训练模型

GLIP: 突破性的图像-语言预训练模型

GLIP是微软研究院开发的图像-语言预训练模型,在多项视觉任务上展现出强大的零样本和少样本迁移能力,为计算机视觉和自然语言处理的结合开辟了新的方向。

GLIP计算机视觉目标检测预训练零样本学习Github开源项目
LSeg: 基于语言驱动的语义分割新模型

LSeg: 基于语言驱动的语义分割新模型

LSeg是一种创新的语言驱动语义图像分割模型,通过文本编码器和图像编码器的结合,实现了灵活的标签表示和出色的零样本分割性能。

LSeg语义分割零样本学习CLIP计算机视觉Github开源项目
YOLO-World: 开创实时开放词汇目标检测新纪元

YOLO-World: 开创实时开放词汇目标检测新纪元

YOLO-World是一种创新的实时开放词汇目标检测模型,它通过视觉-语言建模和大规模数据集预训练,为YOLO赋予了开放词汇检测能力,实现了高效、灵活的目标检测。

YOLO-World目标检测开放词汇预训练模型零样本学习Github开源项目
深入探讨In-context Learning: 从原理到应用的全面综述

深入探讨In-context Learning: 从原理到应用的全面综述

本文全面介绍了In-context Learning(ICL)的发展历程、核心原理、关键技术以及最新研究进展,涵盖了ICL的模型训练、提示词调优、分析评估等多个方面,为读者提供了系统而深入的ICL学习指南。

上下文学习语言模型提示工程预训练零样本学习Github开源项目
CoT-Collection: 推动语言模型通过思维链微调实现零样本和少样本学习的进步

CoT-Collection: 推动语言模型通过思维链微调实现零样本和少样本学习的进步

CoT-Collection 是一个包含 184 万条思维链理由的大规模数据集,覆盖 1060 个任务。通过对语言模型进行思维链微调,可以显著提升其零样本和少样本学习能力,为自然语言处理领域带来新的突破。

CoT-Collection思维链语言模型零样本学习few-shot学习Github开源项目
Recognize Anything: 强大而通用的图像识别模型

Recognize Anything: 强大而通用的图像识别模型

Recognize Anything Model (RAM)是一个开源的图像识别基础模型,可以实现高精度的零样本图像标记和分类。本文将详细介绍RAM的特点、架构和应用,以及它在计算机视觉领域带来的重大突破。

RAM++图像识别开源模型零样本学习多模态Github开源项目
ReCon: 对比重构引导的3D表示学习新方法

ReCon: 对比重构引导的3D表示学习新方法

探索ICML 2023论文提出的ReCon模型,一种结合对比学习和生成式预训练的创新3D表示学习方法,为点云等3D数据的处理和理解带来新突破。

ReCon3D表示学习点云分类零样本学习少样本学习Github开源项目
MS-Diffusion: 多主体零样本图像个性化的布局引导创新

MS-Diffusion: 多主体零样本图像个性化的布局引导创新

MS-Diffusion是一个创新的深度学习框架,通过布局引导实现多主体零样本图像个性化生成。它解决了文本到图像生成中的细节保真度和多主体一致性问题,为个性化文本到图像生成开辟了新的方向。

MS-Diffusion图像生成多主题个性化布局引导零样本学习Github开源项目
AnyDoor:突破性的零样本对象级图像定制技术

AnyDoor:突破性的零样本对象级图像定制技术

AnyDoor是一种创新的人工智能模型,可以实现零样本对象级图像定制。它能够将目标对象无缝地移植到新场景中,为图像编辑和生成领域带来了革命性的突破。本文深入解析AnyDoor的核心技术和应用前景。

AnyDoor图像定制零样本学习目标级处理深度学习Github开源项目
Segment Any Anomaly: 零训练异常分割的创新方法

Segment Any Anomaly: 零训练异常分割的创新方法

Segment Any Anomaly (SAA+)是一种无需训练即可对任意异常进行分割的创新方法。通过结合基础模型和混合提示正则化,SAA+实现了出色的零样本异常检测性能,为计算机视觉领域带来了新的可能性。

SAA+异常分割零样本学习计算机视觉图像处理Github开源项目
VoiceCraft: 突破性的零样本�语音编辑和文本转语音技术

VoiceCraft: 突破性的零样本语音编辑和文本转语音技术

VoiceCraft是一种基于神经编解码语言模型的创新技术,在语音编辑和零样本文本转语音任务上取得了突破性进展,能够处理各种真实场景下的语音数据。

VoiceCraft语音编辑文本转语音神经编解码语言模型零样本学习Github开源项目
GenerSpeech: 突破性的零样本风格迁移文本转语音模型

GenerSpeech: 突破性的零样本风格迁移文本转语音模型

GenerSpeech是一个创新的文本转语音模型,能够实现高保真度的零样本风格迁移,为个性化语音合成开辟了新的可能性。本文深入介绍GenerSpeech的核心技术、特点及应用前景。

GenerSpeech文本到语音风格转换零样本学习多GPU支持Github开源项目
OpenCLIP: 开源实现的CLIP模型

OpenCLIP: 开源实现的CLIP模型

OpenCLIP是OpenAI CLIP模型的开源实现,提供了多种预训练模型和训练代码,支持大规模视觉-语言对比学习。本文详细介绍了OpenCLIP的特点、使用方法和训练技巧。

OpenCLIP预训练模型对比学习图像识别零样本学习Github开源项目