Arxiv 翻译项目

这个仓库旨在应对大量涌现的论文，提供快速浏览 Arxiv 论文的中文网页。为了翻译不同格式的 PDF 文件，我们使用 nougat OCR 库来提取文本。因此，提取过程可能不会很顺利。起初我们考虑翻译 Ar5iv，但 Ar5iv 要一个月后才更新论文，而且只将初始版本转为 HTML，不反映最终版本，所以我们决定自行提取内容。为了准确理解内容，建议阅读原文论文。

论文列表

不支持在新窗口打开。建议通过手动方式在新窗口中打开。

ArXiv ID	标题	ArXiv	前往
2404.19705v2	何时检索教学大语言模型以有效利用信息检索	arXiv	页面
2404.19543	RAG和RAU：自然语言处理中检索增强语言模型的综述	arXiv	页面
2404.14219v1	Phi-3技术报告：在您手机上本地运行的高能力语言模型	arXiv	页面
2404.12241v1	介绍MLCommons的AI安全基准测试v05版本	arXiv	页面
2404.11584v1	新兴AI代理架构在推理、规划和工具调用方面的景观：一项综述	arXiv	页面
2404.10981v1	大型语言模型检索增强文本生成综述	arXiv	页面
2404.10198v1	RAG模型有多忠实？量化RAG与LLM内部先验之间的拉锯战	arXiv	页面
2404.10102v1	金吉拉缩放：一次复现尝试	arXiv	页面
2404.09516v1	新一代网络的状态空间模型替代Transformers：一项综述	arXiv	页面
2404.07965v1	Rho-1：并非所有token都是你所需要的	arXiv	页面
2404.07647v1	为什么小型语言模型表现不佳？通过Softmax瓶颈研究语言模型饱和度	arXiv	页面
2404.07503v1	语言模型合成数据的最佳实践和经验教训	arXiv	页面
2404.07143v1	不遗漏任何上下文：使用Infini-attention的高效无限上下文Transformers	arXiv	页面
2404.06395v1	MiniCPM：通过可扩展训练策略揭示小型语言模型的潜力	arXiv	页面
2404.05875v1	CodecLM：使用定制合成数据对齐语言模型	arXiv	页面
2404.05405	语言模型的物理学第33部分：知识容量缩放定律	arXiv	页面
2404.04167v3	中文小型LLM：预训练以中文为中心的大型语言模型	arXiv	页面
2404.03414v1	小型语言模型能帮助大型语言模型更好地推理吗？LM引导的思维链	arXiv	页面
2404.01261v1	FABLES：评估书籍长度摘要的忠实度和内容选择	arXiv	页面
2404.01204	细微界限：通过下游能力分析探索大型语言模型预训练	arXiv	页面
2403.19270v1	sDPO：不要一次性用完你的所有数据	arXiv	页面
2403.18058v1	COIG-CQIA：中文指令微调只需要质量	arXiv	页面
2403.16971v2	AIOS：大语言模型代理操作系统	arXiv	页面
2403.16952v1	数据混合法则：通过预测语言建模性能优化数据混合	arXiv	页面
2403.15796v2	从损失角度理解语言模型的涌现能力	arXiv	页面
2403.13799v1	反向训练以缓解反转诅咒	arXiv	页面
2403.13187v1	模型合并配方的进化优化	arXiv	页面
2403.10131v1	RAFT：将语言模型适应于特定领域的RAG	arXiv	页面
2403.09629	Quiet-STaR：语言模型可以自学如何在说话前先思考	arXiv	页面
2403.08763	大语言模型持续预训练的简单且可扩展的策略	arXiv	页面
2403.06634	窃取生产环境中语言模型的一部分	arXiv	页面
2403.06563v1	揭开扩展定律之谜第一部分	arXiv	页面
2403.04706v1	常见的7B语言模型已经具备强大的数学能力	arXiv	页面
2403.04652v1	01AI的Yi开放基础模型	arXiv	页面
2403.03883v2	SaulLM-7B：开创性的法律大语言模型	arXiv	页面
2403.02178v1	掩蔽思维：简单掩蔽部分推理步骤可以改善语言模型的数学推理学习	arXiv	页面
2403.01432v2	针对不太流行知识的微调与检索增强生成比较	arXiv	页面
2402.18815v1	大语言模型如何处理多语言？	arXiv	页面
2402.18563v1	接近人类水平的语言模型预测	arXiv	页面
2402.16837v1	大语言模型是否潜在地执行多跳推理？	arXiv	页面
2402.16819v2	Nemotron-4 15B技术报告	arXiv	页面
2402.14714v1	面向多语言大型语言模型的高效有效词汇扩展	arXiv	页面
2402.12847v1	指令微调的语言模型是更好的知识学习者	arXiv	页面
2402.08939v1	前提顺序在大型语言模型推理中很重要	arXiv	页面
2402.07043v1	尾部的故事：模型崩溃作为缩放规律的改变	arXiv	页面
2402.06196v2	大型语言模型综述	arXiv	页面
2402.05120v1	更多智能体就是你所需要的	arXiv	页面
2402.00838v3	OLMo：加速语言模型科学	arXiv	页面
2401.16380v1	重新表述网络：计算和数据高效语言建模的方法	arXiv	页面
2401.10225v1	ChatQA：构建GPT-4级别的对话式问答模型	arXiv	页面
2401.08417v3	对比偏好优化：推动大语言模型在机器翻译中性能的边界	arXiv	页面
2401.05654v1	迈向对话式诊断人工智能	arXiv	页面
2401.03129v1	检验对齐大型语言模型持续预训练中的遗忘现象	arXiv	页面
2401.01055v2	超越英语的LLaMA：语言能力迁移的实证研究	arXiv	页面
2312.05934v3	微调还是检索？比较大语言模型中的知识注入	arXiv	页面
2311.13647	语言模型逆向工程	arXiv	页面
2311.08545	高效持续预训练以构建领域特定大型语言模型	arXiv	页面
2310.11511	自反RAG：通过自我反思学习检索、生成和批评	arXiv	页面
2310.08754v4	大语言模型训练中的分词器选择：可忽略还是至关重要？	arXiv	页面
2310.04799v2	Chat Vector：一种简单的方法，为大语言模型在新语言中赋予指令遵循和模型对齐能力	arXiv	页面
2309.15402	思维链推理的进展、前沿和未来：一项综述	arXiv	页面
2309.12288	反转诅咒：经过"A是B"训练的大语言模型无法学习"B是A"	arXiv	页面
2308.12284	D4：通过文档去重和多样化改进大语言模型预训练	arXiv	页面
2308.11432v5	基于大语言模型的自主智能体调查	arXiv	页面
2308.09583	WizardMath：通过强化进化指令赋能大语言模型的数学推理能力	arXiv	页面
2306.08568	WizardCoder：通过进化指令赋能代码大语言模型	arXiv	页面
2306.01116	Falcon 大语言模型的 RefinedWeb 数据集：仅使用网络数据超越精选语料库	arXiv	页面
2305.18290v2	直接偏好优化：你的语言模型暗中是一个奖励模型	arXiv	页面
2304.12244	WizardLM：赋能大语言模型以遵循复杂指令	arXiv	页面
2304.08177v3	中文 LLaMA 和 Alpaca 的高效有效文本编码	arXiv	页面
2303.18223	大语言模型调查	arXiv	页面
2212.10560	自我指导：通过自生成指令对齐语言模型	arXiv	页面
2110.03215	迈向语言模型的持续知识学习	arXiv	页面
2107.06499	对训练数据去重使语言模型更好	arXiv	页面