语言模型工具集锦:AI工具、网站、应用与开源项目精选

jobbert_knowledge_extraction

jobbert_knowledge_extraction

SkillSpan技能提取

该项目通过优秀的AI模型进行英文职位发布中的技能提取

japanese-stablelm-base-beta-7b

japanese-stablelm-base-beta-7b

自然语言处理开源项目

日本语自然语言处理的7B参数高效模型

KULLM3

KULLM3

NLP&AI LabKULLM3

高性能韩语指令跟踪与对话模型

gemma-2-9b-it-GGUF

gemma-2-9b-it-GGUF

编程语言语言模型

Gemma 2 Instruct模型,支持多语言与复杂文本生成

SmolLM-1.7B-Instruct

SmolLM-1.7B-Instruct

数据集Github

SmolLM-1.7B-Instruct 模型的技术特性与应用场景分析

pythia-2.8b-deduped

pythia-2.8b-deduped

Pythia训练数据

提升语言模型的解释力与科学研究

Breeze-7B-Instruct-v1_0

Breeze-7B-Instruct-v1_0

开源项目模型

增强繁体中文处理能力,提高语言模型性能

Flux-Prompt-Enhance

Flux-Prompt-Enhance

google-t5/t5-base语言模型

文本生成技术提升Prompts表现

Llama-3-Instruct-8B-SPPO-Iter2

Llama-3-Instruct-8B-SPPO-Iter2

Self-Play Preference Optimization模型调优

通过自我博弈偏好优化实现语言模型对齐

codet5-large

codet5-large

代码生成CodeT5

支持多编程语言的代码理解与生成大模型

Swallow-MX-8x7b-NVE-v0.1

Swallow-MX-8x7b-NVE-v0.1

模型性能Huggingface

跨语言文本生成模型,强化日语能力

Stellar-Odyssey-12b-v0.0

Stellar-Odyssey-12b-v0.0

开源项目模型

语言模型合并的先锋工具

Llama-3-KoEn-8B-Instruct-preview

Llama-3-KoEn-8B-Instruct-preview

语言模型pytorch

基于Chat Vector技术的Llama-3-8B语言模型在多语言生成中的应用

GPT-J-6B-Janeway

GPT-J-6B-Janeway

GPT-J 6B-Janeway文本生成

深入了解GPT-J 6B-Janeway在生成科幻与奇幻文本中的应用

gpt2-medium-chinese

gpt2-medium-chinese

语言模型Github

中文文本生成的可靠选择

Truthful_DPO_TomGrc_FusionNet_7Bx2_MoE_13B

Truthful_DPO_TomGrc_FusionNet_7Bx2_MoE_13B

偏好数据Huggingface

利用DPO优化方法提升语言模型的性能

gpt2-small-portuguese

gpt2-small-portuguese

GPorTuguese-2葡萄牙语

葡萄牙语NLP高效精调模型的详细解析

camembert-base-legacy

camembert-base-legacy

预训练Hugging Face

基于RoBERTa的法语语言模型在多任务中的应用

switch-base-32

switch-base-32

HuggingfaceSwitch Transformers

高效稀疏性提升了大规模语言模型训练速度

NeuralSynthesis-7B-v0.1

NeuralSynthesis-7B-v0.1

Huggingface文本生成

NeuralSynthesis-7B-v0.1在多个基准数据集上展示出卓越的文本生成性能