大语言模型的崛起:从ChatGPT到GPT-4
大语言模型如ChatGPT、GPT系列模型等的出现,使得各种模型版本的矩阵变得复杂。基础语言模型未经指令微调,但已能执行多种NLP任务。GPT-3等大型语言模型展现了强大的zero-shot、one-shot和few-shot性能,证明了大力投入做模型的必要性。LaMDA通过微调和用户交互数据,提升了响应的真实可靠性。其他模型如Jurassic-1、Megatron-Turing NLG和Chinchilla等也各具特色,但面临计算资源消耗等问题。