预训练模型工具大全:精选AI工具、网站及开源项目集锦

SuperGradients: 易于使用的顶级计算机视觉模型训练库

SuperGradients: 易于使用的顶级计算机视觉模型训练库

SuperGradients是一个开源的深度学习训练库,专注于计算机视觉任务。它提供了易于使用的API来训练和微调SOTA(State-of-the-Art)模型,包括图像分类、目标检测、语义分割等任务。

SuperGradients深度学习计算机视觉预训练模型模型训练Github开源项目
Pix2Struct:一种革命性的视觉语言理解预训练模型

Pix2Struct:一种革命性的视觉语言理解预训练模型

Pix2Struct是Google Research推出的一种新型视觉语言预训练模型,通过解析网页截图来学习视觉和语言的联合表示,在多个下游任务中取得了最先进的性能。本文将深入介绍Pix2Struct的原理、特点及应用。

Pix2Struct视觉语言理解预训练模型数据预处理实验运行Github开源项目
Battle of the Backbones:计算机视觉任务预训练模型的大规模比较

Battle of the Backbones:计算机视觉任务预训练模型的大规模比较

深入探讨Battle of the Backbones项目,这是一项对多种计算机视觉任务中各种预训练模型进行大规模比较的研究。本文介绍了项目背景、主要研究内容和重要发现,为读者提供了解这一前沿研究的全面视角。

计算机视觉预训练模型图像分类目标检测图像检索Github开源项目
NLP中的Tokenizer:文本分词的关键技术

NLP中的Tokenizer:文本分词的关键技术

Tokenizer是自然语言处理中的一项基础技术,用于将文本分割成更小的单元(通常是单词)。本文介绍了Tokenizer的概念、类型、应用场景以及一个Go语言实现的开源Tokenizer库。

TokenizerGo语言NLP预训练模型分词Github开源项目
自然语言理解(NLU)技术的发展与应用

自然语言理解(NLU)技术的发展与应用

本文深入探讨了自然语言理解(NLU)技术的发展历程、工作原理及其在人工智能领域的重要应用,旨在帮助读者全面了解这一前沿技术。

NLUSpark NLP自然语言处理预训练模型Python库Github开源项目
Awesome-Scientific-Language-Models: 科学领域大型语言模型的综合调查

Awesome-Scientific-Language-Models: 科学领域大型语言模型的综合调查

本文全面介绍了Awesome-Scientific-Language-Models项目,该项目汇集了科学领域预训练语言模型的资源列表,涵盖了数学、物理、化学、生物等多个学科,为科学研究和应用提供了宝贵的参考。

大型语言模型科学领域预训练模型模态知识表示Github开源项目
ReLiK:一个快速轻量级的实体链接和关系抽取模型

ReLiK:一个快速轻量级的实体链接和关系抽取模型

ReLiK是由Sapienza大学自然语言处理团队开发的一个快速而轻量级的信息抽取模型,专门用于实体链接和关系抽取任务。它采用了检索器和阅读器的双组件架构,能够在有限的计算资源下实现高效准确的抽取。

ReLiK实体链接关系抽取信息抽取预训练模型Github开源项目
MindCV: 基于MindSpore的计算机视觉工具箱

MindCV: 基于MindSpore的计算机视觉工具箱

MindCV是一个开源的计算机视觉研究和开发工具箱,基于MindSpore深度学习框架开发。它集成了一系列经典和最先进的视觉模型,如ResNet和SwinTransformer,以及它们的预训练权重和训练策略。

MindCV计算机视觉深度学习框架预训练模型图像分类Github开源项目
深入探索自然语言处理:plm-nlp-code项目解析

深入探索自然语言处理:plm-nlp-code项目解析

本文详细介绍了HIT-SCIR/plm-nlp-code项目,这是一个提供《自然语言处理:基于预训练模型的方法》一书配套代码的开源仓库。文章深入分析了项目结构、代码内容和最新更新,为NLP研究者和学习者提供了宝贵的实践资源。

自然语言处理预训练模型PyTorchTransformers代码示例Github开源项目
YOLO-World: 开创实时开放词汇目标检测新纪元

YOLO-World: 开创实时开放词汇目标检测新纪元

YOLO-World是一种创新的实时开放词汇目标检测模型,它通过视觉-语言建模和大规模数据集预训练,为YOLO赋予了开放词汇检测能力,实现了高效、灵活的目标检测。

YOLO-World目标检测开放词汇预训练模型零样本学习Github开源项目
Vision-LSTM: 革新计算机视觉的新型神经网络架构

Vision-LSTM: 革新计算机视觉的新型神经网络架构

Vision-LSTM 是一种将长短期记忆网络(LSTM)应用于计算机视觉任务的创新架构,它通过捕捉图像的长程依赖关系,在图像分类等多项视觉任务上取得了优异的性能。本文将深入探讨 Vision-LSTM 的原理、特点及其在计算机视觉领域的潜力。

Vision-LSTMViL计算机视觉预训练模型图像处理Github开源项目
BioGPT: 生物医学文本生成与挖掘的突破性人工智能模型

BioGPT: 生物医学文本生成与挖掘的突破性人工智能模型

BioGPT是由微软研究院开发的针对生物医学领域的大型语言模型,它在多项生物医学自然语言处理任务中展现出了超越人类水平的表现,为生物医学研究带来了新的可能性。

BioGPT自然语言处理生物医学文本预训练模型TransformerGithub开源项目
Computer Vision in the Wild: 开启计算机视觉的新纪元

Computer Vision in the Wild: 开启计算机视觉的新纪元

本文深入探讨了Computer Vision in the Wild (CVinW)这一新兴的计算机视觉研究领域,介绍了其核心理念、主要特点和最新进展,展望了CVinW未来的发展方向和潜在应用。

计算机视觉迁移学习预训练模型多模态图像分类Github开源项目
Score Entropy Discrete Diffusion: 离散扩散模型的突破性进展

Score Entropy Discrete Diffusion: 离散扩散模型的突破性进展

Score Entropy Discrete Diffusion是一种新型的离散扩散模型,通过估计数据分布的比率来实现高效的生成建模。该方法在自然语言处理等离散数据领域取得了与自回归模型相当的性能,同时具有独特的算法优势,为语言模型的发展开辟了新的道路。

离散扩散模型PyTorch实现预训练模型采样策略训练代码Github开源项目
Uni2TS: 统一的通用时间序列预测Transformer模型

Uni2TS: 统一的通用时间序列预测Transformer模型

Uni2TS是由Salesforce AI Research开发的PyTorch库,旨在为大规模预训练通用时间序列Transformer提供统一解决方案,并提供时间序列预测的微调、推理和评估工具。

Uni2TS时间序列预测Transformer预训练模型PyTorchGithub开源项目
PLIP: 全方位解析蛋白质-配体相互作用的强大工具

PLIP: 全方位解析蛋白质-配体相互作用的强大工具

PLIP (Protein-Ligand Interaction Profiler) 是一款功能强大的免费开源工具,专门用于全面检测和可视化蛋白质-配体复合物中的非共价相互作用。它为结构生物信息学、药物发现和生物学研究提供了关键的分子识别和蛋白质功能洞察。

PLIP病理学AI预训练模型视觉语言模型Github开源项目
Prov-GigaPath: 突破性全幻灯片基础模型推动数字病理学发展

Prov-GigaPath: 突破性全幻灯片基础模型推动数字病理学发展

Prov-GigaPath是一个基于真实世界数据训练的全幻灯片数字病理学基础模型,为精准医疗和临床发现开辟了新的可能性。本文深入介绍了Prov-GigaPath的创新架构、训练方法和应用前景。

Prov-GigaPath数字病理学深度学习预训练模型医学图像分析Github开源项目
MetaCLIP: 揭秘CLIP数据的新方法

MetaCLIP: 揭秘CLIP数据的新方法

MetaCLIP是由Meta AI研究团队开发的一种新型计算机视觉模型,旨在改进CLIP数据的筛选和处理方法。本文将详细介绍MetaCLIP的主要特点、技术创新以及在计算机视觉领域的潜在应用。

MetaCLIPCLIP图像文本对预训练模型数据清洗Github开源项目
VisionLLaMA: 统一的LLaMA视觉任务骨干网络

VisionLLaMA: 统一的LLaMA视觉任务骨干网络

VisionLLaMA是一个创新的视觉变换器架构,它将LLaMA语言模型的成功设计应用于各种计算机视觉任务。这种统一的建模框架展示了在图像生成、分类、语义分割和目标检测等多个领域的卓越性能,为视觉AI开辟了新的可能性。

VisionLLaMA计算机视觉图像生成图像理解预训练模型Github开源项目
从零开始实现扩散模型:深入理解 DDPM、DDIM 和无分类器引导

从零开始实现扩散模型:深入理解 DDPM、DDIM 和无分类器引导

本文深入探讨了如何从头开始实现扩散模型,包括 DDPM、DDIM 和无分类器引导等技术。通过详细介绍模型架构、训练过程和生成结果,帮助读者全面理解扩散模型的工作原理。

Diffusion模型图像生成ImageNetU-Net预训练模型Github开源项目