微调工具大全:AI模型优化资源汇总

MoRA

MoRA

MoRA微调

大型语言模型的高效参数微调方法

llama-lora-fine-tuning

llama-lora-fine-tuning

LLaMA微调

单GPU微调LLaMA模型的高效方法

mamba-chat

mamba-chat

Mamba-Chat状态空间模型

基于状态空间模型架构的创新聊天AI

bassl

bassl

BaSSL视频场景分割

BaSSL算法推动视频场景分割性能提升

llm-datasets

llm-datasets

LLM数据集

LLM微调优质数据集与工具资源库

client-js

client-js

Mistral JavaScript ClientAPI

Mistral AI API的JavaScript客户端 简化AI开发

Llama3-Tutorial

Llama3-Tutorial

Llama 3微调

Llama 3模型实践教程 从部署到微调评测

axolotl

axolotl

AxolotlAI模型

多功能AI模型微调工具

medAlpaca

medAlpaca

MedAlpaca医疗问答

医疗问答大语言模型套件 助力智能医疗对话

MINI_LLM

MINI_LLM

Mini-llm大模型

完整中文大语言模型训练流程实践

LLMs-Finetuning-Safety

LLMs-Finetuning-Safety

微调语言模型

大语言模型微调对安全性的潜在影响研究

doppel-bot

doppel-bot

DoppelBotSlack

AI聊天机器人模仿用户回复风格

LLaMA-Adapter

LLaMA-Adapter

LLaMA-Adapter微调

轻量级适配方法高效微调大语言模型

LLMs-cookbook

LLMs-cookbook

LLMscookbook

LLMs实践指南 从API应用到模型微调

modal_finetune_sql

modal_finetune_sql

LLaMaText-to-SQL

LLaMa 2模型在Text-to-SQL任务上的微调与应用

DoRA

DoRA

DoRA低秩适应

大型语言模型微调的权重分解低秩适应方法

Platypus

Platypus

PlatypusLLM

高效经济的大语言模型微调开源项目

nano-llama31

nano-llama31

Llama 3.1AI模型

轻量级Llama 3.1架构实现 提供训练微调和推理功能

octo

octo

Octo机器人政策

基于transformer的通用机器人控制策略

trl

trl

TRL微调

用于大型语言模型微调和对齐的开源工具库