值得探索的AI开源项目:工具、网站与应用合集

chinese-macbert-base

chinese-macbert-base

开源项目预训练模型

通过MLM误差校正任务优化中文BERT模型的性能

pythia-1.4b-deduped

pythia-1.4b-deduped

HuggingfaceEleutherAI

用于解释性研究的大规模语言模型套件

Qwen2-72B

Qwen2-72B

Huggingface文本生成

新一代开源大语言模型在多个领域表现出色的中立评估

bert-base-uncased-ag-news

bert-base-uncased-ag-news

开源项目模型

基于BERT的文本序列分类模型

ggml_bakllava-1

ggml_bakllava-1

BakLLaVAllama.cpp

ggml格式提供的llama.cpp兼容推理文件

Meta-Llama-Guard-2-8B

Meta-Llama-Guard-2-8B

责任限制知识产权

基于Llama 3的先进内容安全模型

LaMini-Flan-T5-783M

LaMini-Flan-T5-783M

模型评估模型训练

增强自然语言处理能力的多样化指令微调模型

moshika-pytorch-bf16

moshika-pytorch-bf16

Github模型

实时全双工语音对话的AI模型革新

openchat_3.5

openchat_3.5

对话生成Github

开源创新:OpenChat挑战70B模型新高度

kcbert-base

kcbert-base

数据清洗Github

基于韩语评论数据构建的KcBERT模型实现性能优化

Mistral-7B-OpenOrca-AWQ

Mistral-7B-OpenOrca-AWQ

OpenOrcaAWQ

高效4比特量化,实现多用户并发推理

nq-distilbert-base-v1

nq-distilbert-base-v1

Transformer句子嵌入

句子向量化提升语义搜索与聚类效率

wav2vec2-lv-60-espeak-cv-ft

wav2vec2-lv-60-espeak-cv-ft

语音识别Huggingface

利用微调的wav2vec2模型提升多语言语音和语素识别能力

Qwen2.5-32B-Instruct-GPTQ-Int8

Qwen2.5-32B-Instruct-GPTQ-Int8

大语言模型Github

开源多语言大模型Qwen2.5 32B量化版支持超长文本处理

Timeless

Timeless

FabulousAlphaStable Diffusion

突破性AI图像生成,无需依赖负面提示

bert-base-dutch-cased

bert-base-dutch-cased

University of GroningenBERTje

荷兰语BERT预训练模型,适用于多任务自然语言处理

opus-mt-gl-pt

opus-mt-gl-pt

glg-por翻译

加利西亚语与葡萄牙语翻译模型

Qwen1.5-MoE-A2.7B

Qwen1.5-MoE-A2.7B

Mixture of ExpertsHuggingface

提高模型生成速度与资源效率的Transformer架构MoE语言模型

OPT-13B-Erebus

OPT-13B-Erebus

数据集开源项目

OPT-13B-Erebus模型功能与应用概述

Meta-Llama-3.1-70B-Instruct

Meta-Llama-3.1-70B-Instruct

MetaGithub

支持多语言对话的开源模型