大语言模型的炒作曲线-电子发烧友网

最近几个月，大型语言模型成为了全球的热门词汇，频频登上各大新闻头条。这些复杂的模型，比如 OpenAI 的 GPT-4 和 Meta 的 LLaMA，激发了研究人员、开发人员和公众的想象力。

然而，无异于任何一门具有变革性的技术，大型语言模型也经历过炒作，随之而来的预期波动以及恐惧。2022 年底，随着人们对人工智能与生成式 AI 的期望达到高潮，Gartner 发布了一份炒作周期报告。随着 GPT-4 宣布后，新 AI 产品的开发呈爆炸式增长，时隔不到一年，如今我们处于大型语言模型炒作曲线的什么位置？

大型语言模型究竟是什么？在讨论炒作曲线之前，我们先来介绍一下大型语言模型究竟是什么。这种模型是生成式 AI 的一个子集，生成文本的能力得以优化，特别是在给定提示和相关上下文的情况下预测句子中的下一个单词。这些模型接受了在非常大的数据集上的训练，使用的参数超过十亿个，而且经过了人类（或其他大型语言模型）的微调。这类模型包括 BERT、GPT 和 T5 等。说到底，大型语言模型就是文本计算器，知道如何根据给定的提示，创建人类可以理解的文本。

炒作曲线：从兴奋到现实主义在某种新技术出现时，经常能够观察到炒作曲线。初期阶段，受到崇高的承诺和有远见的预测的驱使，人们会产生极大的兴奋和期待。就大型语言模型而言，生成连贯且与上下文紧密相关的文本的能力带动了最初的炒作。媒体报道了这些模型的惊人功能，激发了各行各业无数人的想象力。同时，对于这类工具的误解而产生的恐惧也引发了很多争议。

过高期望的峰值期随着大型语言模型受到的关注越来越多，对其能力的期望也膨胀至前所未有的高度。人们设想未来人工智能生成的内容将彻底改变新闻业、客户服务、内容创作，乃至个人助理等行业。然而，在这个高峰阶段，我们必须谨记这些模型还远非完美，并且有其局限性。

泡沫化的底谷期在期望峰值过后，大型语言模型的实际情况逐步浮出水面，并由此而进入一段底谷期。虽然这些模型可以生成令人印象深刻的文本或图像，但它们也有可能生成不准确、带有偏见或无意义的输出。此外，在此阶段，围绕人工智能的伦理问题和对此类技术的潜在滥用被放大。结果是，热情消退，公众情绪向怀疑和恐惧倾斜。我认为，如今我们就处于这个阶段，而且我们已经加速通过了过高期望的峰值期！虽然许多个人和公司利用这项技术创造了巨大的价值，但只是少数个例，而且很多人仍处于泡沫化的底谷期。

稳步爬升的光明期随着最初的炒作消退，人们对大型语言模型的理解开始更加真实。研究人员和开发人员积极致力于解决与这些模型相关的局限性和挑战。在微调技巧、数据质量和减少偏差等方面进行了改进。人们的关注从过高的期望过渡到实际应用的改进技术。在稳步爬升的光明期，大型语言模型的真正潜力和价值开始具体化。大型语言模型并不能解决所有的问题，但可以非常接近。根据帕累托法则（又名80/20法则，约仅有20%的因素影响80%的结果），这些工具只有20%的概率帮助你创造80%的价值，具体取决于用例。这些模型以人与机器之间前所未有的方式释放创造力。不仅可以加快构思的过程，而且还可以消除解决问题的许多障碍。

实质生产的高原期 ‍最终，大型语言模型将找到各自的立足之地，并为多个行业做出有意义的贡献。改进部署战略，更好地理解自己的优势和局限性，再加上适当的道德考量，这些模型都能成为有价值的工具。大型语言模型不仅能帮助我们完成内容创建、语言翻译、聊天机器人等任务，甚至能够辅助研究人员的研发工作。实质生产的高原期标志着大型语言模型的成熟阶段，它们将无缝融入我们的生活，并成为提供支持的工具。这一切何时会实现还有待观察，但可能比我们想象的要早！

总结 ‍毫无疑问，大型语言模型在人工智能领域引起了轰动。围绕这些模型的炒作曲线是一个自然而然的过程，任何变革性的技术都会经历。虽然最初过高的期望可能会引发低谷期，但必须承认这些模型具有巨大的潜力。随着技术的不断成熟，难题的攻克，以及应用程序的改进，大型语言模型有望成为加强人类的创造力以及解决问题的宝贵资产。理解和管理炒作曲线，可以帮助我们负责任地利用这些强大的工具，并利用它们改善社会。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1776

文章
43899

浏览量
230647
语言模型

语言模型

+关注

关注
0

文章
436

浏览量
10059

原文标题：大语言模型的炒作曲线

文章出处：【微信号：AI科技大本营，微信公众号：AI科技大本营】欢迎添加关注！文章转载请注明出处。

大语言模型中的语言与知识：一种神秘的分离现象

自然语言处理领域存在着一个非常有趣的现象：在多语言模型中，不同的语言之间似乎存在着一种隐含的对齐关系。

发表于 02-20 14:53 •154次阅读

大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>中的<b class='flag-5'>语言</b>与知识：一种神秘的分离现象

2023年科技圈热词“大语言模型”，与自然语言处理有何关系

电子发烧友网报道（文/李弯弯）大语言模型（LLM）是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本，还能够深入理解文本含义，处理各种自然

发表于 01-02 09:28 •1403次阅读

大语言模型使用指南

在信息爆炸的时代，我们渴望更智能、更高效的语言处理工具。GPT-3.5等大语言模型的崛起为我们提供了前所未有的机会。这不仅是技术的进步，更是人与机器共舞的一幕。本篇文章将带你走进这个奇妙的语言

发表于 12-29 14:18 •356次阅读

大语言模型概述

在科技飞速发展的当今时代，人工智能技术成为社会进步的关键推动力之一。在广泛关注的人工智能领域中，大语言模型以其引人注目的特性备受瞩目。大语言模型的定义及发展历史大

发表于 12-21 17:53 •748次阅读

大语言模型简介：基于大语言模型模型全家桶Amazon Bedrock

本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶：Bedrock对大语言模型进行介绍。大语言模型

发表于 12-04 15:51 •411次阅读

基于检索的大语言模型简介

简介章节讲的是比较基础的，主要介绍了本次要介绍的概念，即检索（Retrieval）和大语言模型（LLM）

发表于 11-15 14:50 •356次阅读

经典PCB温度曲线系统元件

高温焊锡，它提供很强的连接到PCB 。这个方法通常用于可以为作曲线和检验工艺而牺牲一块专门的参考板的运作。应该注意的是保证的锡量，以避免影响曲线。

发表于 11-01 15:24 •190次阅读

揭秘编码器与解码器语言模型

Transformer 架构的问世标志着现代语言大模型时代的开启。自 2018 年以来，各类语言大模型层出不穷。

发表于 10-24 11:42 •402次阅读

腾讯发布混元大语言模型

腾讯发布混元大语言模型腾讯全球数字生态大会上腾讯正式发布了混元大语言模型，参数规模超千亿，预训练语料超2万亿tokens。作为腾讯自研的通用大语

发表于 09-07 10:23 •854次阅读

训练大语言模型带来的硬件挑战

生成式AI和大语言模型（LLM）正在以难以置信的方式吸引全世界的目光，本文简要介绍了大语言模型，训练这些模型带来的硬件挑战，以及GPU和网络

发表于 09-01 17:14 •1120次阅读

七种编程语言的学习曲线

程序员 Dobiasd 绘制七种编程语言的学习曲线图。这些语言是：JavaScript、Java、C++、Python、Lisp、Haskell、PHP

发表于 08-29 17:18 •524次阅读

检索增强的语言模型方法的详细剖析

本篇内容是对于ACL‘23会议上陈丹琦团队带来的Tutorial所进行的学习记录，以此从问题设置、架构、应用、挑战等角度全面了解检索增强的语言模型，作为对后续工作的准备与入门，也希望能给大家带来

发表于 08-21 09:58 •1327次阅读

语言模型的发展历程基于神经网络的语言模型解析

简单来说，语言模型能够以某种方式生成文本。它的应用十分广泛，例如，可以用语言模型进行情感分析、标记有害内容、回答问题、概述文档等等。但理论上，语言

发表于 07-14 11:45 •518次阅读

大型语言模型的应用

大型语言模型（LLM）是一种深度学习算法，可以通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大语言模型（LLM）代表着 AI 领域的重大进步，并有望通过

发表于 07-05 10:27 •1630次阅读

PyTorch教程9.3.之语言模型

电子发烧友网站提供《PyTorch教程9.3.之语言模型.pdf》资料免费下载

发表于 06-05 09:59 •0次下载