0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

揭秘聊天机器人的“大脑”-大语言模型

NVIDIA英伟达 来源:NVIDIA英伟达 2024-04-17 10:01 次阅读

如果说 AI 正处于改变历史的“iPhone 时刻”,那么聊天机器人就是其首批热门应用之一。

聊天机器人的诞生离不开大语言模型,这是一种基于大规模数据集进行预训练的深度学习算法,能够识别、总结、翻译、预测和生成文本及其他形式的内容。这类模型可以在由 NVIDIA GeForce 和 RTX GPU 提供支持的 PC 和工作站上本地运行。

大语言模型擅长总结大量文本,通过数据分类和挖掘来获取见解,以及按照用户指定的风格、语气或形式生成新文本。它们可以促进以各种语言进行的交流,甚至包括人类语言之外的非常规“语言”,例如计算机代码或蛋白质和基因序列。

首代大语言模型只能处理文本,但后续迭代针对其他类型的数据进行了训练。这些多模态大语言模型可以识别和生成图像、音频视频和其他内容形式。

像 ChatGPT 这样的聊天机器人是首批将大语言模型带给消费者的技术应用之一,它们提供了人们熟悉的界面,可以用自然语言提示词对话并作出回复。此后,大语言模型用于帮助开发者编写代码,以及协助科学家推进药物研发和疫苗研制。

然而,很多 AI 模型对算力的需求也不容小觑。将各类先进优化技术和算法(例如量化)与专为 AI 打造的 RTX GPU 结合,可为大语言模型“剪枝”,以使其可运行于 PC 本地,而无需连接互联网。Mistral(为 Chat with RTX 提供支持的大语言模型之一)等新型轻量化大语言模型的异军突起,降低了对算力和存储空间的需求。

为何说大语言模型很重要?

大语言模型的适用性很宽,可用于各个行业和工作流。借助这种多功能性及其本身的高速性能,大语言模型能够为几乎所有基于语言的任务带来性能和效率提升。

9156d6cc-fbdd-11ee-a297-92fbcf53809c.jpg

运行在云端 NVIDIA GPU 上的 DeepL

通过 AI 提供精准的翻译服务。

由于通过 AI 和机器学习来确保输出的准确性,因此像 DeepL 这样的大语言模型被广泛应用于语言翻译。

医学研究人员正在使用教科书和其他医学数据训练大语言模型,以期改善患者护理。零售商正在利用由大语言模型赋能的聊天机器人,为用户提供出色的客户支持体验。金融分析师正在利用大语言模型记录财报电话会议及其他重要会议,并总结会议内容。而这些只是大语言模型应用方式的冰山一角。

Chat with RTX 等聊天机器人和基于大语言模型构建的写作助手正在知识型工作的方方面面留下自己的身影,无论是内容营销、文案写作还是法律相关的任务。编码助手是大语言模型首批支持的应用之一,预示着由 AI 辅助开发软件的未来。目前,ChatDev 为代表的项目,就是将大语言模型和 AI 智能体(可自主帮助回答问题或执行任务的智能机器人)结合起来,构建了由 AI 驱动的,可按需提供服务的虚拟软件公司。用户只需告诉系统需要何种应用,就可以看着系统开展工作了。

如同日常对话一般轻松

许多人第一次接触生成式 AI 是通过 ChatGPT 等聊天机器人,这类机器人通过自然语言简化了大语言模型的使用方式,用户只需告诉模型需要做什么即可。

由大语言模型提供支持的聊天机器人可以帮助起草营销文案,提供度假建议,撰写客户服务邮件,甚至创作原创诗歌。

大语言模型在图像生成和多模态方面取得的进步,扩展了聊天机器人的应用领域,增加了分析和生成图像的功能,同时保留了简单易用的用户体验。用户只需向机器人描述图像或上传照片并要求系统对其进行分析即可。除了聊天之外,还可以利用图像做视觉辅助。

未来的技术进步将帮助大语言模型扩展在逻辑、推理、数学等方面的能力,赋予它们复杂的请求分解为更小子任务的能力。

AI 智能体方面也取得了进展,这类应用能够接受复杂提示词,将其分解为更小的提示词,并自主与大语言模型和其他 AI 系统合作,以便完成提示词交代的任务。ChatDev 是一种典型 AI 智能体,并不意味着智能体的仅能用于技术型任务。

例如,用户可以要求个人 AI 旅行智能体为全家预订出国度假游。该智能体可以将该任务分解为多个子任务,包括行程规划、预订旅游项目和住宿、创建装箱单、寻找遛狗服务人员,然后按顺序逐一独立执行。

借助 RAG 解锁个人数据

虽然大语言模型和聊天机器人在通用场景下已经非常强大,但如果能与个人用户的数据结合使用,它们将变得更加实用。通过这种方式,它们可以帮助分析电子邮件以发现各种趋势,梳理内容繁复的用户手册以找到某个技术问题的解答,或综合和分析多年累积的银行和信用卡对账单。

将特定数据集与大语言模型挂接,检索增强生成(RAG)是最简单有效的方法之一。

91844756-fbdd-11ee-a297-92fbcf53809c.jpg

PC 上的 RAG 示例。

RAG 可利用从外部来源获取的事实资料来提高生成式 AI 模型的准确性和可靠性。通过将大语言模型与几乎任意外部资源连接,用户可通过 RAG 与数据仓库“对话”,同时大语言模型也能借助 RAG 直接引用来源。用户体验相当简便,只需为聊天机器人指明文件或目录即可。

例如,在内容策略最佳实践、营销手段以及对特定行业或客户群体的基本见解等方面,标准的大语言模型具备相关常识。然而,如果通过 RAG 将其与用于产品发布的营销素材连接起来,大语言模型将能够分析内容并帮助规划量身定制的策略。

RAG 适用于任何大语言模型,只要应用本身支持 RAG 即可。NVIDIA Chat with RTX 是通过 RAG 将大语言模型连接到个人数据集的一个演示示例。它可本地运行于配备了 GeForce RTX GPU 或 NVIDIA RTX 专业 GPU 的系统上。

体验 Chat with RTX 的速度与私密性

Chat With RTX 是一款能在本地运行的个性化聊天机器人演示应用,不仅易于使用,还可免费下载。它基于 RAG 构建,且支持 TensorRT-LLM 和 RTX 加速 Chat With RTX 支持多个开源大语言模型,包括 Llama 2 和 Mistral。对 Google 的 Gemma 模型的支持将在后续更新中提供。

919a5da2-fbdd-11ee-a297-92fbcf53809c.jpg

Chat with RTX 可通过 RAG

将用户与其个人数据连接起来。

用户只需将文件放入一个文件夹,并为 Chat With RTX 指明该文件夹的位置,即可轻松将 PC 上的本地文件连接到受支持的大语言模型。之后,Chat With RTX 便可快速回答各类查询,给出相关的回复。

Chat with RTX 运行在 GeForce RTX PC 和 NVIDIA RTX 工作站的 Windows 系统上,因此其速度很快,同时用户的数据保存在本地。Chat with RTX 并不依赖基于云的服务,用户可以在本地 PC 上处理敏感数据,因此无需与第三方共享数据或连接互联网。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8136

    浏览量

    130581
  • GPU芯片
    +关注

    关注

    1

    文章

    292

    浏览量

    5692
  • 聊天机器人
    +关注

    关注

    0

    文章

    278

    浏览量

    12104
  • ChatGPT
    +关注

    关注

    27

    文章

    1411

    浏览量

    4784
  • 大模型
    +关注

    关注

    2

    文章

    1550

    浏览量

    1140

原文标题:解码 AI:揭秘聊天机器人的“大脑” - 大语言模型

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Perplexity将Yelp数据引入其聊天机器人

    Perplexity首席执行官Aravind Srinivas告诉The Verge,许多人正在使用像常规搜索引擎一样的聊天机器人 —— 直接从源头提供他们想要的东西的信息是有意义的,比如选择餐馆。
    的头像 发表于 03-19 17:36 405次阅读
    Perplexity将Yelp数据引入其<b class='flag-5'>聊天机器人</b>

    谷歌AI聊天机器人改名为Gemini

    谷歌(Google)近日宣布,旗下备受瞩目的AI聊天机器人Bard正式更名为Gemini,并推出了一款功能更加强大的付费版本——Gemini Advanced。这一战略调整旨在与微软、OpenAI等科技巨头在AI聊天机器人市场展开更为激烈的竞争。
    的头像 发表于 02-18 11:28 532次阅读

    字节跳动推出AI聊天机器人Coze扣子

    近日,字节跳动正式推出了名为“Coze扣子”的AI聊天机器人开发平台。自2月1日起,这一平台已正式上线,为开发者和用户提供了一个全新的交互体验。
    的头像 发表于 02-03 09:31 762次阅读

    英伟达向聊天机器人初创公司Kore.ai注资1.5亿美元

    据报道,英伟达向聊天机器人制造商Kore.ai注资1.5亿美元。这一投资是英伟达在人工智能领域的最新布局,显示出其对人工智能技术的坚定信心和长远规划。Kore.ai是一家在聊天机器人领域具有领先技术的初创公司,其产品已经得到了可口可乐公司、空中客车公司和罗氏控股公司等大型
    的头像 发表于 01-31 11:20 400次阅读

    如何用AI聊天机器人写出万字长文

    如何用AI聊天机器人写出万字长文
    的头像 发表于 12-26 16:25 497次阅读

    “行空板+大模型”——基于ChatGLM的多角色交互式聊天机器人

    模型,结合了深度学习技术和大量中文语料的训练成果。它在自然语言理解和生成方面展现了出色性能,为国内的自然语言处理研究与应用提供了有力支持。 通过使用行空板和UGB喇叭,你可以制作一个有趣好玩的
    的头像 发表于 12-08 14:11 325次阅读

    基于Redis Enterprise,LangChain,OpenAI 构建一个电子商务聊天机器人

    鉴于最近人工智能支持的API和网络开发工具的激增,许多科技公司都在将聊天机器人集成到他们的应用程序中。LangChain是一种备受欢迎的新框架,近期引起了广泛关注。该框架旨在简化开发人员与语言模型
    的头像 发表于 11-25 08:04 204次阅读
    基于Redis Enterprise,LangChain,OpenAI 构建一个电子商务<b class='flag-5'>聊天机器人</b>

    英伟达计划芯片设计过程中使用聊天机器人

    据英伟达首席科学家Bill Dally介绍,“我们发现许多资深设计师花费了大量的时间来回答初级设计师的问题。利用聊天机器人回答初级设计问题可以为高级设计师节省大量时间。”
    的头像 发表于 10-31 17:16 708次阅读

    Meta面向年轻用户推出一款生成型人工智能聊天机器人

    据《华尔街日报》报道,Meta正准备在内部推出一款名为“Gen AI Personas”的生成型人工智能聊天机器人,面向年轻用户。据报道,它们将于近日开始的公司Meta Connect活动期间推出
    的头像 发表于 10-07 17:05 753次阅读

    全球与中国AI聊天机器人市场:增长趋势、竞争格局与前景展望

    与人类用户进行对话。 它可以使用自然语言处理(NLP)和机器学习(ML)等各种技术和方法来构建。 聊天机器人有多种类型,包括基于规则的聊天机器人和自学习
    的头像 发表于 08-01 18:07 1104次阅读

    印度Dukaan推出应用生成式AI聊天机器人

          近日印度电子商务初创公司Dukaan宣布采用生成式人工智能(AI)聊天机器人来改善其客服工作。据了解这一举措大大提高了客服效率,并显著降低了成本。 Dukaan公司在应用生成式AI聊天机器人
    的头像 发表于 07-17 10:21 389次阅读

    人工智能推动的聊天机器人可能会改变我们搜索信息方式

    改变我们搜索信息的方式,因为这些聊天机器人非常善于回答问题。 这就引出了另一个问题:如果用户可以以对话的形式向人工智能模型询问信息,那么该用户为什么还要依赖需要点击链接和跳转几个网页的搜索引擎呢? IEEE高级会员E
    的头像 发表于 07-03 17:37 451次阅读

    聊天机器人开源分享

    电子发烧友网站提供《聊天机器人开源分享.zip》资料免费下载
    发表于 06-20 15:07 1次下载
    <b class='flag-5'>聊天机器人</b>开源分享

    医疗保健领域AI聊天机器人时代的用户安全和隐私保护

    使用基于人工智能的聊天机器人的一个重大风险是拟人化,患者错误地将类似人类的品质和情感归因于聊天机器人。由于缺乏真正的人类理解和同理心,这可能会导致不切实际的期望、误解和潜在的有害情况。为了降低这种
    发表于 06-15 09:42 296次阅读

    Snapchat将免费提供其人工智能聊天机器人

    Snap将向Snapchat的7.5亿月用户免费发布其“My AI”聊天机器人,这一举措距离OpenAI驱动的聊天机器人首次向该应用的300多万付费用户开放不到两个月。
    的头像 发表于 05-18 17:37 1762次阅读