最佳Github AI工具与开源项目集锦

Chicago95

Chicago95

Chicago95XFCE

为XFCE和Xubuntu打造的Windows 95风格主题集

thunderbird-patches

thunderbird-patches

BetterbirdThunderbird

Betterbird项目的Thunderbird增强补丁库

echelon

echelon

EchelonMozilla Firefox

经典Firefox界面重现 复古浏览体验

mteb

mteb

MTEB文本嵌入

多任务文本嵌入模型评估基准

data-selection-survey

data-selection-survey

语言模型数据选择

全面探索语言模型数据选择的关键技术

Data-Provenance-Collection

Data-Provenance-Collection

Data Provenance InitiativeAI数据集

跨学科倡议推动AI训练数据集透明度和责任使用

bigcodebench

bigcodebench

BigCodeBench代码生成

高难度代码生成基准测试评估LLM编程能力

starcoder2

starcoder2

StarCoder 2代码生成模型

先进的多语言代码生成模型家族

turbo-art

turbo-art

turbo.artSDXL Turbo

基于SDXL Turbo的实时AI图像编辑平台

llm-finetuning

llm-finetuning

LLM微调Modal

Modal和axolotl驱动的大语言模型高效微调框架

ZeroEval

ZeroEval

ZeroEval语言模型评估

统一评估框架测试语言模型零样本推理

modal-client

modal-client

ModalPython库

Modal Python库实现无服务器云计算按需访问

doppel-bot

doppel-bot

DoppelBotSlack

AI聊天机器人模仿用户回复风格

diffusion-forcing

diffusion-forcing

Diffusion Forcing深度学习

创新机器学习方法结合下一步预测和全序列扩散技术

dclm

dclm

DataComp-LM大语言模型

大型语言模型训练与评估的开源综合框架

BELLE

BELLE

BELLE大语言模型

推动中文大语言模型的开源发展与指令微调

ktransformers

ktransformers

KTransformersLLM推理优化

体验前沿LLM推理优化的灵活框架

Score-Entropy-Discrete-Diffusion

Score-Entropy-Discrete-Diffusion

离散扩散模型PyTorch实现

基于数据分布比率估计的离散扩散模型

SRe2L

SRe2L

数据集蒸馏大规模数据

创新的ImageNet规模数据集压缩技术

evaluate

evaluate

Evaluate指标

多框架兼容的机器学习评估工具库