大语言模型:精选AI工具、网站与开源项目

大语言模型

SEED-Story

SEED-Story

SEED-Story多模态故事生成

多模态长篇故事生成系统

ProAgent

ProAgent

ProAgent自动化

将人工智能引入流程自动化的创新方案

WizardLM

WizardLM

WizardLM大语言模型

增强大型语言模型执行复杂指令的开源项目

chain-of-thought-hub

chain-of-thought-hub

复杂推理能力大语言模型

大型语言模型复杂推理能力评估基准

BMTools

BMTools

BMTools大语言模型

开源工具集成平台 赋能语言模型新能力

Progressive-Hint

Progressive-Hint

大语言模型推理能力

提升大型语言模型推理能力的新方法

DoRA

DoRA

DoRA低秩适应

大型语言模型微调的权重分解低秩适应方法

ALCE

ALCE

ALCE大语言模型

增强大语言模型生成引用文本的基准工具

InstructionWild

InstructionWild

InstructWild指令数据集

大规模用户生成指令数据集助力AI对话能力提升

pythia

pythia

Pythia大语言模型

大语言模型训练过程知识演化分析开源项目

RedPajama-Data

RedPajama-Data

RedPajama-Data-v2大语言模型

开放大规模多语言数据集助力大型语言模型训练

gemma

gemma

Gemma大语言模型

Google DeepMind开源的Gemma大语言模型

CMLM-ZhongJing

CMLM-ZhongJing

CMLM-ZhongJing中医

中医大语言模型结合古今智慧推动医学创新

Awesome-Remote-Sensing-Multimodal-Large-Language-Model

Awesome-Remote-Sensing-Multimodal-Large-Language-Model

大语言模型遥感

远程遥感多模态大语言模型资源全面汇总

calculate-flops.pytorch

calculate-flops.pytorch

calflopsFLOPs计算

神经网络模型计算工具:FLOPs、MACs和参数量分析

MGM

MGM

Mini-Gemini多模态视觉语言模型

多模态视觉语言模型的潜力挖掘与创新

Megatron-LM

Megatron-LM

Megatron-LMMegatron-Core

优化GPU训练技术 加速大规模Transformer模型

Step-DPO

Step-DPO

Step-DPO长链推理

优化大语言模型长链推理的高效方案

MInference

MInference

MInference大语言模型

动态稀疏注意力加速长上下文语言模型

sglang

sglang

SGLang大语言模型

大语言模型和视觉语言模型高效服务框架