值得探索的AI开源项目:工具、网站与应用合集

Yi-1.5-6B-Chat

Yi-1.5-6B-Chat

基准测试语料库

提升代码、数学、推理能力的开源AI模型

MythoMax-L2-13B-GPTQ

MythoMax-L2-13B-GPTQ

量化模型GPTQ

多样化GPTQ参数选择,满足多种硬件配置需求

distilbert-base-cased-distilled-squad

distilbert-base-cased-distilled-squad

WebMLHuggingface

模型ONNX转换支持网页使用

Meta-Llama-3-70B-Instruct-GGUF

Meta-Llama-3-70B-Instruct-GGUF

Meta-Llama开源项目

Llama 3 70B语言模型介绍与应用

internlm2_5-1_8b-chat

internlm2_5-1_8b-chat

Github模型

开源18亿参数模型提升推理能力与工具调用效率

Italia-9B-Instruct-v0.1

Italia-9B-Instruct-v0.1

Italia 9B数据安全

意大利语大型语言模型,适用于金融和公共管理等关键领域

MiniCPM-V-2

MiniCPM-V-2

场景文本理解MiniCPM-V

多模态语言模型,支持跨平台高效部署

LongCite-llama3.1-8b

LongCite-llama3.1-8b

长上下文开源项目

LongCite-llama3.1-8b在长上下文问答中实现高效引用生成

V-Express

V-Express

稳定扩散音频编码器

V-Express项目中的多媒体智能转换技术

half_illustration

half_illustration

tok风格LoRA

半插图半照片图像生成的创意模型

llama_3.1_q4

llama_3.1_q4

模型训练Huggingface

高效文本生成模型,结合优化技术提升性能

Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic

Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic

开源项目Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic

多语种量化优化模型,显著降低内存占用

Infinity-Instruct-3M-0625-Yi-1.5-9B

Infinity-Instruct-3M-0625-Yi-1.5-9B

无强化学习模型训练

大规模指令调优模型无需人类反馈的创新

japanese-reranker-cross-encoder-xsmall-v1

japanese-reranker-cross-encoder-xsmall-v1

日本語CrossEncoder

小型高效的日语Reranker模型,通过CrossEncoder技术实现精确排序

ProteusV0.4

ProteusV0.4

AI绘图风格增强

提升ProteusV0.4的图像生成精度与风格丰富性

roberta-base

roberta-base

模型训练Habana处理器

适用于HPU的模型优化与推理配置指南

SmolLM-1.7B-Instruct

SmolLM-1.7B-Instruct

数据集Github

SmolLM-1.7B-Instruct 模型的技术特性与应用场景分析

pythia-2.8b-deduped

pythia-2.8b-deduped

Pythia训练数据

提升语言模型的解释力与科学研究

Breeze-7B-Instruct-v1_0

Breeze-7B-Instruct-v1_0

开源项目模型

增强繁体中文处理能力,提高语言模型性能

faster-distil-whisper-large-v2

faster-distil-whisper-large-v2

CTranslate2量化

通过CTranslate2实现的高效音频转录转换方案