最佳Github AI工具与开源项目集锦

aiges

aiges

AIGESAI服务引擎

简化AI模型部署与服务化的开源工具

tower-sessions

tower-sessions

tower-sessions中间件

Tower和Axum框架的轻量级会话管理中间件

ICL_PaperList

ICL_PaperList

上下文学习语言模型

上下文学习研究论文集,从预训练到应用

FlagData

FlagData

FlagData数据处理

多功能数据处理工具包 优化AI模型开发流程

ceval

ceval

C-Eval基础模型

全面评估中文大语言模型能力的基准测试

InstructionWild

InstructionWild

InstructWild指令数据集

大规模用户生成指令数据集助力AI对话能力提升

Classical-Modern

Classical-Modern

文言文现代文

文言文与现代汉语的大规模平行语料库

matter-js

matter-js

Matter.js物理引擎

JavaScript 2D物理引擎 为Web开发提供真实物理模拟

MoE-LLaVA

MoE-LLaVA

MoE-LLaVA大视觉语言模型

高效视觉语言模型的新方向

FouriScale

FouriScale

FouriScale高分辨率图像生成

无需训练的高分辨率图像合成方法

VIRL

VIRL

V-IRL虚拟智能

将虚拟智能融入现实生活的创新平台

pythia

pythia

Pythia大语言模型

大语言模型训练过程知识演化分析开源项目

RedPajama-Data

RedPajama-Data

RedPajama-Data-v2大语言模型

开放大规模多语言数据集助力大型语言模型训练

gemma

gemma

Gemma大语言模型

Google DeepMind开源的Gemma大语言模型

img2dataset

img2dataset

img2dataset图像数据集

高效处理大规模图像数据集的开源工具

HAT

HAT

图像超分辨率HAT

激活更多像素的图像超分辨率转换器

Long-CLIP

Long-CLIP

Long-CLIPCLIP

CLIP模型长文本处理能力升级 显著提升图像检索效果

Awesome_Long_Form_Video_Understanding

Awesome_Long_Form_Video_Understanding

长视频理解视频分析

长视频理解研究前沿进展与资源综述

WanJuan1.0

WanJuan1.0

WanJuan多模态语料库

开源多模态语料库推动AI模型性能提升

SAN

SAN

开放词汇语义分割Side Adapter Network

轻量高效的开放词汇语义分割框架