预训练模型工具大全：精选AI工具、网站及开源项目集锦

基于细粒度后期交互的多模态检索增强视觉问答系统

本文介绍了一种新型的视觉问答系统FLMR,它通过细粒度的后期多模态交互检索来增强视觉问答能力。该系统在OK-VQA等基准测试中取得了显著的性能提升,为知识密集型视觉问答任务提供了新的解决方案。

FLMR视觉问答多模态检索预训练模型基准测试Github开源项目

RNA-FM: 革命性的RNA基础模型及其在结构与功能预测中的应用

RNA-FM是一个基于非编码RNA序列训练的基础模型,通过自监督学习方法在无标注数据上进行预训练,为RNA结构和功能预测任务提供了高度准确的表示学习能力。本文将深入介绍RNA-FM的原理、特点及其在RNA研究中的广泛应用。

RNA-FMRNA语言模型RNA结构预测RNA功能预测预训练模型Github开源项目

单细胞转换器模型的发展与应用

本文全面介绍了单细胞转换器模型在生物信息学领域的最新进展,包括模型架构、预训练策略、下游任务等方面,并探讨了这些模型在单细胞数据分析中的广泛应用前景。

Transformers单细胞组学预训练模型基因表达细胞注释Github开源项目

Octo：先进的通用机器人策略模型

Octo是一个基于Transformer的机器人策略模型，通过800,000多个多样化的机器人轨迹数据进行训练，为联邦政府最复杂的IT挑战提供创新解决方案。

Octo机器人政策AI模型预训练模型微调Github开源项目

LeRobot：赋能机器人技术的开源AI平台

LeRobot是由Hugging Face开发的开源AI机器人平台，旨在通过端到端学习方法使机器人技术更加平易近人和易于使用，为开发者和研究人员提供了强大的工具和资源。

LeRobot机器人强化学习模拟环境预训练模型Github开源项目

Youku-mPLUG:开创中文视频-语言预训练新纪元

Youku-mPLUG是一个包含1000万规模的高质量中文视频-语言数据集,为中文视频理解任务提供了全新的基准和预训练资源。本文详细介绍了Youku-mPLUG的特点、构建过程以及在多个下游任务上的应用效果。

Youku-mPLUG视频语言数据集预训练模型多模态基准测试Github开源项目

NLP论文学习指南：100篇重要论文及研究方向详解

本文总结了NLP领域的100篇重要论文,涵盖了主要研究方向和热点话题,为NLP学习者和研究者提供了系统的论文阅读指南。

NLP论文研究知识图谱预训练模型信息抽取Github开源项目

Retrieval-Augmented Visual Question Answering:一种基于多模态检索的视觉问答新方法

Retrieval-Augmented Visual Question Answering (RA-VQA)是一种新型的视觉问答方法,通过引入外部知识和多模态检索来提升问答性能。本文介绍了RA-VQA的最新进展,包括Fine-grained Late-interaction Multi-modal Retrieval (FLMR)等技术,并提供了详细的实现指南。

FLMR视觉问答多模态检索预训练模型基准测试Github开源项目