状态: 存档(代码按原样提供,不会有更新)
来自论文"语言模型是无监督的多任务学习器"的代码和模型。
你可以在我们的原始博客文章、6个月后的跟进文章和最终文章中了解GPT-2及其分阶段发布的情况。
我们还发布了一个数据集供研究人员研究其行为。
<sup>*</sup> 注意,由于一个错误,我们原始的参数计数是错误的(在我们之前的博客文章和论文中)。因此你可能看到小型模型被称为117M,中型模型被称为345M。
这个仓库旨在为研究人员和工程师提供一个实验GPT-2的起点。
有关基本信息,请参阅我们的模型卡片。
如果你正在进行有趣的GPT-2研究或应用开发,请告诉我们!我们特别感兴趣听取并可能与那些正在研究以下内容的人合作:
请使用以下bibtex条目:
@article{radford2019language,
title={Language Models are Unsupervised Multitask Learners},
author={Radford, Alec and Wu, Jeff and Child, Rewon and Luan, David and Amodei, Dario and Sutskever, Ilya},
year={2019}
}
我们可能会发布用于评估模型在各种基准测试上表现的代码。
我们仍在考虑发布更大的模型。


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!


多风格AI绘画神器
堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

