本文由 ChatMoney团队出品
前言
Generative Pre-trained Transformer(GPT)系列是由OpenAI开发的预训练语言模型,它们在多种NLP任务中取得了令人瞩目的成绩,包括文章生成、代码生成、机器翻译和问答等。GPT系列模型的核心思想是通过无监督学习在大规模语料库上进行预训练,再通过少量数据进行微调以适应特定任务。随着模型容量的增加和训练数据的扩大,GPT系列模型的能力也在不断提升。
| 模型 |
发布时间 |
参数量 |
预训练数据量 |
| GPT |
2018 年 6 月 |
1.17 亿 |
约 5GB |
| GPT |
2019 年 2 月 |
15 亿 |
40GB |
| GPT |
2020 年 5 月 |
1,750 亿 |
45TB |
GPT-1:无监督学习与通用预训练
在GPT-1问世之前,传统的自然语言处理(NLP)模型主要依赖于有监督学习,这种方法要求大量带有明确标签的数据进行任务特定的模型训练。然而,有监督学习存在两大局限性:
-
数据标注的挑战:高质量的标注数据往往难以获取,特别是在一些复杂场景中,如图像标注或情感分析,数据的标签可能模糊或不清晰。
-
模型泛化能力的

2981

被折叠的 条评论
为什么被折叠?



