指令微调工具合集 - 精选高效AI解决方案

OctoPack: 基于指令微调的代码大语言模型

OctoPack: 基于指令微调的代码大语言模型

OctoPack是一个基于指令微调的代码大语言模型项目,包含了大规模代码数据集、指令微调模型以及评估基准。本文介绍了OctoPack的主要组成部分、数据处理流程、模型训练方法以及评估方案,为代码大模型的研究提供了宝贵的资源和方法。

OctoPack代码大语言模型指令微调CommitPackHumanEvalPackGithub开源项目
多模态大语言模型的最新进展:一场AI视觉与语言融合的革命

多模态大语言模型的最新进展:一场AI视觉与语言融合的革命

本文全面介绍了多模态大语言模型(MLLM)的最新研究进展,包括模型架构、训练方法、应用场景等,深入探讨了MLLM在视觉-语言智能融合方面的巨大潜力及未来发展方向。

多模态大语言模型视觉语言模型指令微调视频理解模型评估Github开源项目
SEED-X: 多模态人工智能的革命性突破

SEED-X: 多模态人工智能的革命性突破

SEED-X是一个统一而多功能的基础模型,通过多粒度理解和生成能力,可以在现实世界中充当各种多模态AI助手,满足用户的多样化需求。本文深入介绍了SEED-X的特点、应用场景以及最新进展。

SEED-X多模态模型AI助手图像编辑指令微调Github开源项目
Otter: 一个基于OpenFlamingo的多模态AI模型

Otter: 一个基于OpenFlamingo的多模态AI模型

Otter是一个基于OpenFlamingo的多模态AI模型,通过在MIMIC-IT数据集上进行上下文指令微调,实现了优秀的指令遵循和上下文学习能力。本文详细介绍了Otter模型的特点、MIMIC-IT数据集的构建过程,以及Otter在图像和视频理解等多模态任务中的应用。

OtterMIMIC-IT多模态指令微调视觉语言处理Github开源项目
从零开始构建迷你语言模型:一步步打造属于自己的AI助手

从零开始构建迷你语言模型:一步步打造属于自己的AI助手

本文详细介绍了如何从头开始构建一个小型语言模型(LLM),包括预训练、指令微调和对齐等关键步骤,为读者提供了一个完整的LLM开发流程指南。

build_MiniLLM_from_scratchbert4torchTorch4keras预训练指令微调Github开源项目
H2O WizardLM:开源实现自动生成高质量指令数据集

H2O WizardLM:开源实现自动生成高质量指令数据集

H2O WizardLM 是一个开源项目,可以自动生成高质量的指令数据集,用于进一步微调大型语言模型。它基于 WizardLM 的方法,通过现有的指令调优模型生成复杂的指令提示,为构建真正开放的 ChatGPT 克隆铺平了道路。

wizardlmLLM自动生成ChatGPT克隆指令微调Github开源项目
LESS: 一种创新的数据选择方法用于目标指令调优

LESS: 一种创新的数据选择方法用于目标指令调优

LESS是一种新的数据选择方法,旨在从大规模指令调优数据集中选择最具影响力的数据来诱导特定目标能力。本文将详细介绍LESS的工作原理、实现步骤以及在实际应用中的效果。

LESS数据选择指令微调模型训练评估Github开源项目
DecryptPrompt: 探索人工智能的前沿 - Prompt工程与大语言模型的综合指南

DecryptPrompt: 探索人工智能的前沿 - Prompt工程与大语言模型的综合指南

深入解析DecryptPrompt项目,全面介绍Prompt工程、大语言模型论文、开源数据与模型,以及AIGC应用,为AI爱好者和研究者提供宝贵的学习资源。

解密Prompt系列LLM指令微调大模型AI应用Github开源项目
Firefly: 一站式大模型训练工具的全面解析

Firefly: 一站式大模型训练工具的全面解析

深入探讨Firefly项目,了解这个强大的大模型训练工具如何支持主流开源大模型的预训练、指令微调和DPO,以及其在训练效率和模型性能方面的突出表现。

Firefly大模型训练指令微调预训练QLoRAGithub开源项目
YAYI 2: 多语言开源大语言模型的新突破

YAYI 2: 多语言开源大语言模型的新突破

YAYI 2是一个具有30亿参数的多语言开源大语言模型,在多项基准测试中表现优异,为中文和多语言自然语言处理研究提供了新的可能。

雅意大模型人工智能指令微调多轮对话开源Github开源项目
本草模型: 基于中文医学知识的大语言模型指令微调

本草模型: 基于中文医学知识的大语言模型指令微调

本文介绍了由哈尔滨工业大学社会计算与信息检索研究中心健康智能组开发的本草模型,这是一个基于中文医学知识进行指令微调的大语言模型。本草模型通过医学知识图谱和医学文献构建数据集,对LLaMA等基础模型进行微调,显著提升了模型在医疗领域的问答能力。

本草中文医学知识大语言模型指令微调HuaTuoGithub开源项目