最佳Github AI工具与开源项目集锦

MambaOut

MambaOut

MambaOut计算机视觉

高效视觉模型展示简洁架构卓越性能

Megatron-LM

Megatron-LM

Megatron-LMMegatron-Core

优化GPU训练技术 加速大规模Transformer模型

babilong

babilong

BABILong长文本处理

BABILong基准测试长文本处理能力 评估大语言模型极限

Quest

Quest

长上下文LLM推理稀疏性

长文本LLM推理的查询感知稀疏化框架

llm-awq

llm-awq

AWQLLM

激活感知权重量化技术实现大语言模型高效压缩与加速

AGIEval

AGIEval

AGIEval基准测试

全面评估AI模型人类认知能力的基准测试

Step-DPO

Step-DPO

Step-DPO长链推理

优化大语言模型长链推理的高效方案

loft

loft

LOFT长上下文基准

探索百万级token长文本处理的前沿基准

MInference

MInference

MInference大语言模型

动态稀疏注意力加速长上下文语言模型

sglang

sglang

SGLang大语言模型

大语言模型和视觉语言模型高效服务框架

faiss

faiss

Faiss向量相似度搜索

快速向量搜索与聚类库

ttt-lm-pytorch

ttt-lm-pytorch

TTTRNN

基于测试时训练的高表达能力RNN模型

KIVI

KIVI

KIVIKV缓存量化

高效2比特KV缓存量化算法提升大型语言模型性能

Platypus

Platypus

PlatypusLLM

高效经济的大语言模型微调开源项目

CoT-Collection

CoT-Collection

CoT-Collection思维链

思维链微调数据集提升语言模型少样本学习能力

single-cell-transformer-papers

single-cell-transformer-papers

Transformers单细胞组学

Transformer模型在单细胞组学分析中的应用概览

egnn-pytorch

egnn-pytorch

EGNN图神经网络

PyTorch实现的E(n)等变图神经网络

En-transformer

En-transformer

E(n)-Equivariant Transformer神经网络

融合等变图神经网络与Transformer的创新架构

GPU-Benchmarks-on-LLM-Inference

GPU-Benchmarks-on-LLM-Inference

LLaMAGPU

GPU和Apple芯片在LLaMA 3推理性能基准对比

Whisper-Finetune

Whisper-Finetune

Whisper语音识别

语音识别模型的高效微调与加速