指令微调工具合集 - 精选高效AI解决方案

build_MiniLLM_from_scratch 入门学习资料汇总 - 从零构建迷你大语言模型

build_MiniLLM_from_scratch 入门学习资料汇总 - 从零构建迷你大语言模型

本文汇总了build_MiniLLM_from_scratch项目的学习资料,包括代码仓库、预训练语料、模型训练过程等,帮助读者快速入门并构建自己的迷你大语言模型。

build_MiniLLM_from_scratchbert4torchTorch4keras预训练指令微调Github开源项目
h2o-wizardlm学习资料汇总 - 将文档转换为LLM微调的问答对的开源工具

h2o-wizardlm学习资料汇总 - 将文档转换为LLM微调的问答对的开源工具

h2o-wizardlm是H2O.ai开发的开源项目,用于将文档转换为LLM微调的问答对。本文汇总了该项目的相关学习资源,帮助读者快速了解和上手使用这一强大工具。

wizardlmLLM自动生成ChatGPT克隆指令微调Github开源项目
LESS学习资料汇总 - 选择有影响力数据进行目标指令调优

LESS学习资料汇总 - 选择有影响力数据进行目标指令调优

LESS是一种用于选择有影响力数据进行目标指令调优的方法。本文汇总了LESS项目的相关学习资源,包括代码库、论文、数据集等,帮助读者快速了解和上手这一技术。

LESS数据选择指令微调模型训练评估Github开源项目
DecryptPrompt学习资源汇总 - 解密Prompt工程和大语言模型技术的宝库

DecryptPrompt学习资源汇总 - 解密Prompt工程和大语言模型技术的宝库

本文汇总了DecryptPrompt项目的相关学习资源,包括官方文档、论文总结、开源数据集和模型等,帮助读者快速了解和学习Prompt工程与大语言模型相关技术。

解密Prompt系列LLM指令微调大模型AI应用Github开源项目
Firefly大模型训练工具-学习资料汇总-支持主流大模型的一站式训练平台

Firefly大模型训练工具-学习资料汇总-支持主流大模型的一站式训练平台

Firefly是一个开源的大模型训练工具,支持对主流大模型进行预训练、指令微调和DPO。本文汇总了Firefly的主要功能、支持模型、训练数据、模型评测等相关学习资料,帮助读者快速了解和使用这个强大的大模型训练平台。

Firefly大模型训练指令微调预训练QLoRAGithub开源项目
YAYI大模型学习资源汇总 - 基于LlaMA 2的中文多领域大语言模型

YAYI大模型学习资源汇总 - 基于LlaMA 2的中文多领域大语言模型

本文汇总了YAYI大模型的相关学习资源,包括项目介绍、模型下载、运行方法、训练数据等,帮助读者快速了解和上手这个开源的中文大语言模型。

雅意大模型人工智能指令微调多轮对话开源Github开源项目
Huatuo-Llama-Med-Chinese 学习资料汇总 - 基于中文医学知识的大语言模型指令微调项目

Huatuo-Llama-Med-Chinese 学习资料汇总 - 基于中文医学知识的大语言模型指令微调项目

本文汇总了Huatuo-Llama-Med-Chinese项目的相关学习资源,包括项目介绍、代码仓库、模型下载、使用教程等,帮助读者快速了解和使用这个开源的中文医疗大语言模型。

本草中文医学知识大语言模型指令微调HuaTuoGithub开源项目
Instruction-tuned Stable Diffusion: 通过InstructPix2Pix实现更精准的图像处理

Instruction-tuned Stable Diffusion: 通过InstructPix2Pix实现更精准的图像处理

本文介绍了Hugging Face团队如何通过指令微调来增强Stable Diffusion模型的图像处理能力,使其能够更好地理解和执行特定的图像编辑指令。

Stable Diffusion指令微调图像处理卡通化低级图像处理Github开源项目
Lion:专有大型语言模型的对抗性蒸馏

Lion:专有大型语言模型的对抗性蒸馏

探索Lion项目如何通过创新的对抗性蒸馏框架,从封闭源大语言模型中提取知识,训练出一个小型但高性能的开源语言模型。

Lion大型语言模型对抗蒸馏指令微调自然语言处理Github开源项目
Awesome Multimodal Large Language Models: 一站式多模态大语言模型资源库

Awesome Multimodal Large Language Models: 一站式多模态大语言模型资源库

本文全面介绍了多模态大语言模型(MLLM)的最新进展,包括数据集、模型架构、训练技术、应用场景等,为研究人员和开发者提供了一个全面的MLLM资源库。

多模态大语言模型指令微调上下文学习思维链视觉推理Github开源项目
UrbanGPT: 城市时空大语言模型的突破性研究

UrbanGPT: 城市时空大语言模型的突破性研究

UrbanGPT是一种创新的城市时空大语言模型,它能够在各种城市任务中展现出卓越的泛化能力。通过将时空依赖编码器与指令调优范式相结合,UrbanGPT使大语言模型能够理解时间和空间的复杂相互依赖关系,从而在数据稀缺的情况下实现更全面和准确的预测。

UrbanGPT时空大语言模型城市任务指令微调预训练Github开源项目
INTERS: 利用指令微调释放大型语言模型在搜索中的潜力

INTERS: 利用指令微调释放大型语言模型在搜索中的潜力

INTERS是一个创新的指令微调数据集,旨在增强大型语言模型在信息检索任务中的能力。本文详细介绍了INTERS的设计理念、数据构建过程、任务类型以及实验结果,展示了其在提升LLM搜索性能方面的重要价值。

INTERS大语言模型信息检索指令微调自然语言处理Github开源项目
GraphGPT: 大型语言模型的图指令微调

GraphGPT: 大型语言模型的图指令微调

GraphGPT是一个创新的框架,通过图指令微调范式将大型语言模型与图结构知识相结合。它能够增强语言模型对图结构信息的理解和处理能力,为图学习任务提供更准确和有上下文的响应。

GraphGPT大语言模型图结构知识指令微调图学习Github开源项目
HugNLP: 基于HuggingFace Transformer的统一全面NLP库

HugNLP: 基于HuggingFace Transformer的统一全面NLP库

HugNLP是一个基于HuggingFace Transformer的统一、全面的自然语言处理库,旨在为NLP研究人员提供便利和高效的工具。本文详细介绍了HugNLP的架构、核心功能以及应用场景,展示了其在NLP领域的创新和实用价值。

HugNLPNLP预训练语言模型指令微调应用开发Github开源项目
Granite代码模型:IBM开源的强大代码智能基础模型

Granite代码模型:IBM开源的强大代码智能基础模型

IBM发布了Granite系列代码模型,这是一组专为代码生成任务设计的开源基础模型,涵盖了3B到34B参数的多种规模,在多项代码智能任务中达到了最先进的性能水平。

Granite Code Models代码生成指令微调开源模型评估基准Github开源项目
PMC-LLaMA: 开源医学语言模型的突破性进展

PMC-LLaMA: 开源医学语言模型的突破性进展

PMC-LLaMA是一个专为医学领域设计的开源大型语言模型,通过创新的训练方法和海量医学文献数据,在多项医学任务上展现出卓越性能,甚至超越了一些商业闭源模型。本文深入剖析PMC-LLaMA的技术细节、训练过程和评估结果,探讨其在推动医疗人工智能发展中的重要意义。

PMC-LLaMA医疗语言模型预训练指令微调医学问答Github开源项目
YAYI-UIE: 中科闻歌研发的先进信息抽取大模型

YAYI-UIE: 中科闻歌研发的先进信息抽取大模型

YAYI-UIE是由中科闻歌算法团队研发的信息抽取大模型,在百万级高质量人工标注数据上进行指令微调,实现了通用、专业领域的信息抽取能力。

YAYI-UIE信息抽取大模型指令微调开源Github开源项目
基于大语言模型的视频理解技术研究进展

基于大语言模型的视频理解技术研究进展

本文综述了基于大语言模型的视频理解(Vid-LLMs)的最新研究进展,包括模型架构、训练策略、任务、数据集和评测基准等方面,并讨论了Vid-LLMs在各领域的应用前景。

视频理解大语言模型多模态指令微调视频分析Github开源项目
春雨与莎士比亚的邂逅:一场跨越时空的诗意交流

春雨与莎士比亚的邂逅:一场跨越时空的诗意交流

这篇文章以春雨的视角,描绘了一场与英国古代诗人莎士比亚的想象对话。通过优美的意象和富有诗意的语言,展现了春雨与自然的和谐,以及对莎士比亚文学作品的赞美。文章充满了对生命、自然和文学的热爱,展现了春雨作为自然使者的独特视角。

BELLE大语言模型开源社区中文优化指令微调Github开源项目
IEPile: 一个大规模信息抽取语料库的突破性进展

IEPile: 一个大规模信息抽取语料库的突破性进展

探索IEPile项目如何通过构建大规模高质量语料库,推动信息抽取技术的发展,为自然语言处理领域带来新的机遇与挑战。

IEPile信息抽取大规模数据集指令微调双语Github开源项目