语言模型工具集锦:AI工具、网站、应用与开源项目精选

h2o-danube3-4b-chat

h2o-danube3-4b-chat

使用注意事项Huggingface

H2O.ai推出支持离线运行的4亿参数聊天模型

PowerLM-3b

PowerLM-3b

开源项目PowerLM-3b

基于Power学习率调度器训练的高性能3B参数小型语言模型

DARE_TIES_13B

DARE_TIES_13B

配置文件大模型

通过合并多种预训练语言模型提升AI性能

Qwen1.5-14B

Qwen1.5-14B

HuggingfaceQwen1.5

基于Transformer的多语言大模型 支持32K上下文长度

Orca-2-13b

Orca-2-13b

语言模型人工智能

微软开源专注推理能力提升的研究型语言模型

opt-30b

opt-30b

Huggingface机器学习

Meta AI开发的开源预训练语言模型GPT-3替代方案

Jamba-tiny-dev

Jamba-tiny-dev

机器学习模型调试

轻量级机器学习模型助力Jamba架构开发调试

Llama-3.1-8b-ITA

Llama-3.1-8b-ITA

Llama-3.1-8b-ITA自然语言处理

意大利语优化版Llama-3.1语言模型实现79.17%测试精确度

dolly-v2-7b

dolly-v2-7b

transformer开源项目

基于Pythia的开源指令微调语言模型

Qwen1.5-72B

Qwen1.5-72B

Transformer架构开源项目

支持多语言与性能提升的单向解码模型

Llama-3-8b-sft-mixture

Llama-3-8b-sft-mixture

语言模型RLHF

基于多样化高质量数据集训练的大语言模型微调检查点

wav2vec2-xls-r-300m-mixed

wav2vec2-xls-r-300m-mixed

KerasGithub

wav2vec2模型在多语言环境下的创新语音识别解决方案

Qwen2.5-72B-Instruct-GGUF

Qwen2.5-72B-Instruct-GGUF

长上下文支持Qwen

新一代多语言模型,提升指令理解与长文本处理

MixTAO-7Bx2-MoE-v8.1

MixTAO-7Bx2-MoE-v8.1

MixTAO-7Bx2-MoEHuggingface

深入了解MixTAO-7Bx2-MoE-v8.1的性能与技术更新

pythia-1b-deduped

pythia-1b-deduped

HuggingfaceEleutherAI

Pythia模型家族为大规模语言模型的可解释性研究提供了全面支持

Llama-3SOME-8B-v1-GGUF

Llama-3SOME-8B-v1-GGUF

语言模型炼丹

经过小说写作训练优化的轻量级语言模型

Llama-3.2-3B-Instruct-4bit

Llama-3.2-3B-Instruct-4bit

开源许可机器学习

MLX框架专用的Llama 3.2指令模型4位精度优化版

Arabic-Whisper-CodeSwitching-Edition

Arabic-Whisper-CodeSwitching-Edition

代码转换Github

针对阿拉伯语和英语混合语音的优化识别模型

mt5-xl

mt5-xl

mT5Huggingface

多语言文本转换模型,支持101种语言

dolphin-2.9.4-llama3.1-8b-gguf

dolphin-2.9.4-llama3.1-8b-gguf

Huggingface机器学习

Llama3.1衍生的开放对话模型Dolphin 2.9.4