DeepSeek-V2-Lite-Chat-GGUF

项目介绍：DeepSeek-V2-Lite-Chat-GGUF

DeepSeek-V2-Lite-Chat-GGUF 是一种由 DeepSeek-ai 团队开发的对话模型。该模型基于 DeepSeek-V2-Lite-Chat 基础模型，经过量化处理后形成了多个版本。量化处理的目的是为了在特定应用场景中优化性能与模型大小，使其能够适应不同环境的需求。

基础模型

运行环境

提示模板结构

一个示例提示模板如下：

<|begin_of_sentence|>{system_message}

User: {user_message_1}

Assistant: {assistant_message_1}<|end_of_sentence|>User: {user_message_2}

Assistant:

模型上下文大小

DeepSeek-V2-Lite-Chat-GGUF 经过 Second State Inc. 的量化，形成多个适合不同需求的版本。以下是部分量化模型及其特点：

DeepSeek-V2-Lite-Chat-Q2_K.gguf
- 量化方法：Q2_K
- 比特位：2
- 大小：6.43 GB
- 优缺点：最小化且有显著质量损失，不推荐一般用途
DeepSeek-V2-Lite-Chat-Q4_K_M.gguf
- 量化方法：Q4_K_M
- 比特位：4
- 大小：10.4 GB
- 优缺点：中等大小，质量平衡，是推荐的选择
DeepSeek-V2-Lite-Chat-Q5_K_M.gguf
- 量化方法：Q5_K_M
- 比特位：5
- 大小：11.9 GB
- 优缺点：较大体积，极低质量损失，是推荐的选择
DeepSeek-V2-Lite-Chat-Q6_K.gguf
- 量化方法：Q6_K
- 比特位：6
- 大小：14.1 GB
- 优缺点：非常大，极低质量损失