语言模型工具集锦:AI工具、网站、应用与开源项目精选

OLMo-1B-0724-hf

OLMo-1B-0724-hf

机器学习Github

Dolma数据集驱动的英语语言模型在性能上的进步

bigyi-15b

bigyi-15b

bigyi-15b开源项目

合并模型技术的进步:探索创新设计

Arabic-Orpo-Llama-3-8B-Instruct

Arabic-Orpo-Llama-3-8B-Instruct

Huggingface阿拉伯语

优化Meta-Llama-3模型在阿拉伯语文本生成中的表现

Lexora-Lite-3B

Lexora-Lite-3B

语言模型神经网络

意大利语指令生成与自动化对话模型

galactica-1.3b

galactica-1.3b

语言模型Transformer架构

基于Transformer的科学应用语言模型探索

Gemma-2-9B-Chinese-Chat

Gemma-2-9B-Chinese-Chat

HuggingfaceGemma-2-9B-Chinese-Chat

首个专为中英文用户优化的指令调优模型

gbert-large

gbert-large

语言模型性能

提升德语文本处理效能的高性能BERT模型

COKAL-DPO_test-v2-13b

COKAL-DPO_test-v2-13b

语言模型训练数据集

采用LLaMA2架构的13B规模自动回归语言模型

OLMo-7B

OLMo-7B

模型性能Huggingface

专注于语言模型科学的开放模型

sarashina2-7b

sarashina2-7b

Sarashina2-7B语言模型

该语言模型支持多语言文本生成,涵盖日语与英语

rut5-base-absum

rut5-base-absum

数据集Github

结合多任务训练的俄语文本抽象摘要模型

CodeQwen1.5-7B-Chat-GGUF

CodeQwen1.5-7B-Chat-GGUF

CodeQwen1.5长上下文

支持92种编程语言的强大代码生成模型

DeepSeek-Coder-V2-Lite-Base

DeepSeek-Coder-V2-Lite-Base

Github数学推理

强大开源语言模型,支持代码与数学任务

bertweet-large

bertweet-large

Huggingface开源项目

大规模英语推文预训练模型,面向社交媒体文本

leandojo-lean4-retriever-byt5-small

leandojo-lean4-retriever-byt5-small

LeanDojo开源项目

利用检索增强模型改进定理证明技术

prometheus-7b-v2.0

prometheus-7b-v2.0

权重合并绝对评分

用于语言模型评估的开源工具与反馈优化

Qwen1.5-110B-Chat

Qwen1.5-110B-Chat

HuggingfaceQwen1.5

多语言模型与人类偏好优化的显著提升

umberto-wikipedia-uncased-v1

umberto-wikipedia-uncased-v1

UmBERTo词汇表

UmBERTo模型专注意大利语NLP任务

olm-roberta-base-dec-2022

olm-roberta-base-dec-2022

Huggingface开源项目

OLM项目的更新模型,增强了语言任务表现

chatglm-6b

chatglm-6b

AI技术开源项目

中英双语开源对话模型实现低显存本地部署