大语言模型
AIOS是一个创新的大语言模型(LLM)智能体操作系统,旨在将LLM嵌入操作系统作为其大脑。本文深入探讨了AIOS的架构、功能特性及其在人工智能领域的重要意义。
CodeFuse是一个致力于开发代码大语言模型(Code LLMs)的项目,旨在支持和增强全生命周期AI原生软件开发,涵盖从设计需求、编码、测试、构建到部署、运维和洞察分析等关键阶段。
LLMBox是一个综合性的大语言模型(LLM)开发工具库,提供统一的训练流程和全面的模型评估功能,旨在简化LLM的实现过程并提高开发效率。
深入了解Meta推出的Llama-agentic-system框架,探讨其核心功能、组件和应用场景,以及如何利用该框架构建具备多步推理、工具使用和安全保护能力的智能代理系统。
本文介绍了一种新的知识前缀适配器方法KoPA,旨在通过结合知识图谱的结构信息来增强大语言模型在知识图谱补全任务中的推理能力。KoPA通过结构嵌入预训练和虚拟知识令牌生成,为大语言模型提供了更丰富的上下文信息,从而显著提升了其在知识图谱补全任务中的表现。
KnowPAT是一种新颖的大语言模型偏好对齐方法,通过构建知识偏好集和设计新的对齐目标,实现了模型与人类知识偏好的统一,在领域特定问答任务中取得了显著效果。
T-Eval是一个创新的评估框架,旨在逐步评估大型语言模型的工具使用能力。它将工具使用能力分解为多个子过程,提供了一种全面而细致的评估方法,为大型语言模型的能力分析提供了新的视角。
Persona Hub是一个包含10亿多样化人物角色的大规模数据库,由腾讯AI实验室开发,旨在推动合成数据创建的新范式。本文深入探讨了Persona Hub的开发背景、技术细节和潜在应用,揭示了其如何为大语言模型研究与应用带来突破性影响。
探讨大型语言模型(LLM)的数据管理策略,包括预训练和微调阶段的数据处理方法,以及如何通过优化数据质量和数量来提升模型性能。