Qwen2.5-14B-Instruct-GGUF

Qwen2.5-14B-Instruct-GGUF

提升语言生成能力支持多语言的14B指令微调模型

Qwen2.5-14B-Instruct-GGUF 模型在编码、数学和多语言支持方面表现卓越,能够生成最高达8K tokens的长文本,并支持128K的上下文长度。该模型适用于聊天与角色扮演,优化的指令跟随和结构化输出,覆盖29种语言,多语言能力强劲。为用户提供良好的长文本生成与结构化数据处理体验。

Github长上下文支持模型开源项目语言模型多语言支持Huggingface指令调整Qwen2.5

项目介绍:Qwen2.5-14B-Instruct-GGUF

概述

Qwen2.5 是Qwen系列最新的大型语言模型之一。本次发布包括从5亿到720亿参数的多个基本语言模型和指令调优语言模型。与Qwen2相比,Qwen2.5在多个领域有显著的提升:

  • 增强的知识量以及在编码数学方面显著提升的能力,特别得益于我们在这些领域的专家模型。
  • 指令跟随显著改进,能够生成超过8000个标记的长文本,理解和生成结构化数据(如表格和JSON),对系统提示的多样性更具弹性,从而改进角色扮演和条件设置的实现。
  • 支持长达128K标记的长上下文,并可生成最多8K标记。
  • 多语言支持超过29种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等。

这个仓库包含经过指令调优的14B Qwen2.5模型,采用GGUF格式,其特点如下:

  • 类型:因果语言模型
  • 培训阶段:预训练与后训练
  • 架构:使用RoPE、SwiGLU、RMSNorm和Attention QKV偏差的变压器
  • 参数数量:14.7B
  • 非嵌入参数数量:13.1B
  • 层数:48
  • 注意力头数(GQA):Q为40个,KV为8个
  • 上下文长度:完整32,768个标记,生成8,192个标记
    • 注意:目前只有vLLM支持用于长度拓展的YARN。如果希望处理长达131,072个标记的序列,请参考非GGUF模型。
  • 量化:q2_K、q3_K_M、q4_0、q4_K_M、q5_0、q5_K_M、q6_K、q8_0

更多详情,请参阅我们的博客GitHub文档

快速入门

请查看我们的llama.cpp文档以获取更多使用指南。

建议克隆llama.cpp并按照官方指南进行安装。以下演示假设你在llama.cpp库下运行命令。

由于克隆整个库可能效率不高,可以手动下载所需的GGUF文件或使用huggingface-cli命令:

  1. 安装
    pip install -U huggingface_hub
  2. 下载
    huggingface-cli download Qwen/Qwen2.5-14B-Instruct-GGUF --include "qwen2.5-14b-instruct-q5_k_m*.gguf" --local-dir . --local-dir-use-symlinks False

对于大文件,我们将其分割成多个段以适应上传限制。它们共享一个前缀,后缀显示其索引。例如,从qwen2.5-14b-instruct-q5_k_m-00001-of-00003.ggufqwen2.5-14b-instruct-q5_k_m-00003-of-00003.gguf。上述命令将下载所有文件。

  1. (可选)合并: 对于拆分文件,您需要首先用以下命令合并它们:
    # ./llama-gguf-split --merge <first-split-file-path> <merged-file-path> ./llama-gguf-split --merge qwen2.5-14b-instruct-q5_k_m-00001-of-00003.gguf qwen2.5-14b-instruct-q5_k_m.gguf

对于用户,建议在对话模式下启动以获得类聊天机器人体验:

./llama-cli -m <gguf-file-path> \ -co -cnv -p "You are Qwen, created by Alibaba Cloud. You are a helpful assistant." \ -fa -ngl 80 -n 512

评估与性能

详细评估结果已在📑博客中报告。

对于量化模型,原始bfloat16模型的基准测试结果请参考这里

关于对GPU内存的需求和各自的吞吐量,见结果这里

编辑推荐精选

豆包

豆包

字节跳动旗下 AI 智能助手

字节跳动旗下 AI 智能助手

GPT Plus|Pro充值

GPT Plus|Pro充值

GPT充值

支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。

GPT Image 2中文站

GPT Image 2中文站

AI 图片生成平台

GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。

Vecbase

Vecbase

你的AI Agent团队

Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

下拉加载更多