0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大语言模型的炒作曲线

AI科技大本营 来源:CSDN 2023-07-12 16:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近几个月,大型语言模型成为了全球的热门词汇,频频登上各大新闻头条。这些复杂的模型,比如 OpenAI 的 GPT-4 和 Meta 的 LLaMA,激发了研究人员、开发人员和公众的想象力。

然而,无异于任何一门具有变革性的技术,大型语言模型也经历过炒作,随之而来的预期波动以及恐惧。2022 年底,随着人们对人工智能与生成式 AI 的期望达到高潮,Gartner 发布了一份炒作周期报告。 随着 GPT-4 宣布后,新 AI 产品的开发呈爆炸式增长,时隔不到一年,如今我们处于大型语言模型炒作曲线的什么位置?

4b1a7f4e-2085-11ee-962d-dac502259ad0.png

大型语言模型究竟是什么? 在讨论炒作曲线之前,我们先来介绍一下大型语言模型究竟是什么。这种模型是生成式 AI 的一个子集,生成文本的能力得以优化,特别是在给定提示和相关上下文的情况下预测句子中的下一个单词。这些模型接受了在非常大的数据集上的训练,使用的参数超过十亿个,而且经过了人类(或其他大型语言模型)的微调。这类模型包括 BERT、GPT 和 T5 等 。 说到底,大型语言模型就是文本计算器,知道如何根据给定的提示,创建人类可以理解的文本。

炒作曲线:从兴奋到现实主义 在某种新技术出现时,经常能够观察到炒作曲线。初期阶段,受到崇高的承诺和有远见的预测的驱使,人们会产生极大的兴奋和期待。 就大型语言模型而言,生成连贯且与上下文紧密相关的文本的能力带动了最初的炒作。媒体报道了这些模型的惊人功能,激发了各行各业无数人的想象力。同时,对于这类工具的误解而产生的恐惧也引发了很多争议。

过高期望的峰值期 随着大型语言模型受到的关注越来越多,对其能力的期望也膨胀至前所未有的高度。人们设想未来人工智能生成的内容将彻底改变新闻业、客户服务、内容创作,乃至个人助理等行业。然而,在这个高峰阶段,我们必须谨记这些模型还远非完美,并且有其局限性。

泡沫化的底谷期 在期望峰值过后,大型语言模型的实际情况逐步浮出水面,并由此而进入一段底谷期。虽然这些模型可以生成令人印象深刻的文本或图像,但它们也有可能生成不准确、带有偏见或无意义的输出。此外,在此阶段,围绕人工智能的伦理问题和对此类技术的潜在滥用被放大。 结果是,热情消退,公众情绪向怀疑和恐惧倾斜。 我认为,如今我们就处于这个阶段,而且我们已经加速通过了过高期望的峰值期! 虽然许多个人和公司利用这项技术创造了巨大的价值,但只是少数个例,而且很多人仍处于泡沫化的底谷期。

稳步爬升的光明期 随着最初的炒作消退,人们对大型语言模型的理解开始更加真实。研究人员和开发人员积极致力于解决与这些模型相关的局限性和挑战。在微调技巧、数据质量和减少偏差等方面进行了改进。 人们的关注从过高的期望过渡到实际应用的改进技术。在稳步爬升的光明期,大型语言模型的真正潜力和价值开始具体化。 大型语言模型并不能解决所有的问题,但可以非常接近。根据帕累托法则(又名80/20法则,约仅有20%的因素影响80%的结果),这些工具只有20%的概率帮助你创造80%的价值,具体取决于用例。这些模型以人与机器之间前所未有的方式释放创造力。不仅可以加快构思的过程,而且还可以消除解决问题的许多障碍。

实质生产的高原期 ‍最终,大型语言模型将找到各自的立足之地,并为多个行业做出有意义的贡献。改进部署战略,更好地理解自己的优势和局限性,再加上适当的道德考量,这些模型都能成为有价值的工具。 大型语言模型不仅能帮助我们完成内容创建、语言翻译、聊天机器人等任务,甚至能够辅助研究人员的研发工作。实质生产的高原期标志着大型语言模型的成熟阶段,它们将无缝融入我们的生活,并成为提供支持的工具。这一切何时会实现还有待观察,但可能比我们想象的要早!

总结 ‍毫无疑问,大型语言模型在人工智能领域引起了轰动。围绕这些模型的炒作曲线是一个自然而然的过程,任何变革性的技术都会经历。虽然最初过高的期望可能会引发低谷期,但必须承认这些模型具有巨大的潜力。 随着技术的不断成熟,难题的攻克,以及应用程序的改进,大型语言模型有望成为加强人类的创造力以及解决问题的宝贵资产。 理解和管理炒作曲线,可以帮助我们负责任地利用这些强大的工具,并利用它们改善社会。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49793

    浏览量

    261983
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11269

原文标题:大语言模型的炒作曲线

文章出处:【微信号:AI科技大本营,微信公众号:AI科技大本营】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    3万字长文!深度解析大语言模型LLM原理

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持本文转自:腾讯技术工程作者:royceshao大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验
    的头像 发表于 09-02 13:34 3128次阅读
    3万字长文!深度解析大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>LLM原理

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 952次阅读

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。https
    的头像 发表于 04-30 18:34 1087次阅读
    小白学大<b class='flag-5'>模型</b>:从零实现 LLM<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    如何借助大语言模型打造人工智能生态系统

    语言模型(LLMs)正以革命性的姿态重塑我们与科技的互动模式。然而,由于其庞大的规模,它们往往属于资源密集型范畴,不仅大幅推高了成本,还造成了能源消耗的激增。本文深入剖析了大语言模型
    的头像 发表于 04-27 09:19 910次阅读
    如何借助大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>打造人工智能生态系统

    ​VLM(视觉语言模型)​详细解析

    视觉语言模型(Visual Language Model, VLM)是一种结合视觉(图像/视频)和语言(文本)处理能力的多模态人工智能模型,能够理解并生成与视觉内容相关的自然
    的头像 发表于 03-17 15:32 7745次阅读
    ​VLM(视觉<b class='flag-5'>语言</b><b class='flag-5'>模型</b>)​详细解析

    无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?

    无法在 OVMS 上运行来自 Meta 的大型语言模型 (LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时遇到错误。
    发表于 03-05 08:07

    小白学大模型:训练大语言模型的深度指南

    在当今人工智能飞速发展的时代,大型语言模型(LLMs)正以其强大的语言理解和生成能力,改变着我们的生活和工作方式。在最近的一项研究中,科学家们为了深入了解如何高效地训练大型语言
    的头像 发表于 03-03 11:51 1229次阅读
    小白学大<b class='flag-5'>模型</b>:训练大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的深度指南

    语言模型的解码策略与关键优化总结

    本文系统性地阐述了大型语言模型(LargeLanguageModels,LLMs)中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工程师提供了全面
    的头像 发表于 02-18 12:00 1119次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的解码策略与关键优化总结

    一文详解视觉语言模型

    视觉语言模型(VLM)是一种多模态、生成式 AI 模型,能够理解和处理视频、图像和文本。
    的头像 发表于 02-12 11:13 3339次阅读
    一文详解视觉<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    腾讯公布大语言模型训练新专利

    近日,腾讯科技(深圳)有限公司公布了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的新专利。该专利的公布,标志着腾讯在大语言模型训练领域取得了新的突破。 据专利摘要显示,
    的头像 发表于 02-10 09:37 748次阅读

    Deepseek上单片机?RT-Thread上跑通大语言模型

    前言单片机也能聊天?RT-Thread上跑通大语言模型在RT-Thread论坛上忽然看到了单片机和大模型对话的文章,想着春节期间看到大语言模型
    的头像 发表于 02-07 18:59 2423次阅读
    Deepseek上单片机?RT-Thread上跑通大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    基于Arm Ethos-U85 NPU部署小语言模型

    随着人工智能 (AI) 的演进,人们对使用小语言模型 (SLM) 在嵌入式设备上执行 AI 工作负载的兴趣愈发高涨。
    的头像 发表于 01-20 09:53 968次阅读

    望获实时Linux系统与大语言模型深度融合,开创实时智能无限可能!

    语言模型的崛起为智能化应用开辟了新的可能性。借助深度学习技术,这些模型能够理解和生成自然语言,处理复杂的文本和语义信息。这使得它们在诸如人机问答、内容生成和数据分析等领域展现出巨大的
    的头像 发表于 01-08 13:44 1061次阅读

    语言模型管理的作用

    要充分发挥语言模型的潜力,有效的语言模型管理非常重要。以下,是对语言模型管理作用的分析,由AI部
    的头像 发表于 01-02 11:06 583次阅读

    AI大语言模型开发步骤

    开发一个高效、准确的大语言模型是一个复杂且多阶段的过程,涉及数据收集与预处理、模型架构设计、训练与优化、评估与调试等多个环节。接下来,AI部落小编为大家详细阐述AI大语言
    的头像 发表于 12-19 11:29 1256次阅读