0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI大模型「量子速读」,一分钟抵人类五小时

智能感知与物联网技术研究所 来源:智能感知与物联网技术研 2023-05-15 09:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OpenAI 的 GPT-4 可以处理的上下文 token 最多可达 32k(约 50 页文本)。如今,前 OpenAI 员工创建的 Anthropic 公司再次升级了对标模型 Claude,将上下文 token 扩展到了 100k,处理速度也大大加快。

最近一段时间,OpenAI 凭借 GPT 系列模型以及 ChatGPT,一直是最受关注的研究机构。但最近两年,一家 AI 初创公司正在走进大家的视野,这家公司名为 Anthropic,成立于 2021 年,专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。

不知大家是否还记得 2020 年末,OpenAI 核心员工集体离职事件,当时这件事在 AI 圈还引起了不小的轰动。Anthropic 就是由这些离职的人员创建的,其中包括 OpenAI 前研究副总裁 Dario Amodei、GPT-3 论文一作 Tom Brown 等人。

今年一月,Anthropic 已筹集了超过 7 亿美元的资金,最新一轮的估值达到了 50 亿美元。与此同时,在 ChatGPT 发布两个月后,这家公司就迅速开发了一种对标老东家 ChatGPT 的人工智能系统 Claude。

Claude 申请访问地址:https://www.anthropic.com/earlyaccess

Claude 使用了 Anthropic 自行开发的一种被称为「constitutional AI」的机制,其旨在提供一种「基于原则」的方法使 AI 系统与人类意图保持一致。

Claude 可以完成摘要总结、搜索、协助创作、问答、编码等任务。根据用户反馈,Claude 生成有害输出的可能性较小,更容易进行对话,并且更易于控制。除此以外,Claude 还可以根据指示来设定个性、语气和行为。

9b82c368-f2b5-11ed-90ce-dac502259ad0.gif

不过 Anthropic 并没有提供关于 Claude 的太多技术细节,但在论文《Constitutional AI: Harmlessness from AI Feedback》中描述了 Claude 背后技术,感兴趣的读者可以前去查看。

论文地址:https://arxiv.org/pdf/2212.08073.pdf

早在一月份,就有研究者对 Claude 一次性可以处理的最大文本量进行了测试,显示 Claude 可以回忆起 8k 个 token 中的信息。

时隔没多久,本周四,Anthropic 推出了 100K Context Windows,它将 Claude 的上下文窗口从 9k token 扩展到了 100k,这相当于 75,000 个单词。这意味着企业可以提交数百页材料让 Claude 消化和解释,并且与它的对话可以持续数小时甚至数天。现在可以通过 Anthropic API 访问 100K context windows。

9bbadab4-f2b5-11ed-90ce-dac502259ad0.png

我们知道,大模型越先进,能够同时处理的文本就越长,7.5 万字是个什么概念呢?大概相当于一键总结《哈利波特》第一部。

9be57558-f2b5-11ed-90ce-dac502259ad0.jpg

看起来绝大多数论文、新闻报道和中短篇小说都不在话下了。

Claude 再进化:真「AI 量子速读」

根据科学研究,普通人可以在 5 小时左右的时间里阅读 100,000 个 token,并可能需要更长的时间来消化、记忆和分析这些信息。现在 Claude 可以在不到 1 分钟的时间里完成这些。

9bfe33fe-f2b5-11ed-90ce-dac502259ad0.png

上下文窗口的一般计算。

Anthropic 首先将《了不起的盖茨比》的整个文本加载到了 Claude-Instant(72 K tokens,Claude 两个版本 Claude 和 Claude Instant,Claude 是最先进的高性能模型,而 Claude Instant 是更轻、更便宜、更快的选择。)中,并修改了一行「Carraway 先生是一位在 Anthropic 从事机器学习工作的软件工程师」。当 Anthropic 要求模型找出与原文的不同之处时,它会在 22 秒内给出正确答案。

除了阅读长文本之外,Claude 还有助于从文档中检索信息,从而对业务运营产生助益。用户可以将多个文档甚至一本书放入 prompt 中,然后向 Claude 提出问题(需要对文本的很多部分进行综合知识分析)。对于复杂的问题,这可能比基于向量搜索的方法有效得多。Claude 可以按照用户的指令返回他们正在搜寻的信息,就像人类助手一样。

Anthropic 接着将大语言集成工具 LangChain API 开发者文档(240 页)放入模型中,然后针对所提问题给出了使用 Anthropic 语言模型的 LangChain demo。

9c15e986-f2b5-11ed-90ce-dac502259ad0.gif

与此同时,100k token 可以转换为 6 个小时左右的音频。AssemblyAI 对此做了很好的演示,他们将一个长播客转录为了近 58k 个单词,然后使用 Claude 进行摘要总结和问答。

9c677aee-f2b5-11ed-90ce-dac502259ad0.png

图源:AssemblyAI

总之,使用 100k context windows,用户可以做到如下:

消化、总结和解释财务报表或研究论文等密集文件;

基于公司年度报告分析战略风险和机遇;

评估一项立法的利弊;

识别法律文件中的风险、主题和不同形式的争论;

阅读数百页的开发者文档,并给出技术问题的答案;

通过将整个代码库放入上下文并智能地构建或修改以快速制作原型。

有网友用以下梗图形象地描述了 Context Windows 与 Claude 100k、GPT-4 32K 的关系。

至于价格,Anthropic 技术人员 Ben Mann 表示,100K Context Windows 的百万 token 售价与以往模型一样。

9cbbd472-f2b5-11ed-90ce-dac502259ad0.png

9cceec42-f2b5-11ed-90ce-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253
  • OpenAI
    +关注

    关注

    9

    文章

    1248

    浏览量

    10263
  • ChatGPT
    +关注

    关注

    31

    文章

    1599

    浏览量

    10390

原文标题:一口气看完《哈利波特》:AI大模型「量子速读」,一分钟抵人类五小时

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    天数智芯通用GPU产品Day 0适配GLM-5.1开源模型

    从3分钟Vibe Coding(氛围编程)到30分钟Agentic Engineering(智能体工程),再到如今8小时Long-Horizon Task(长程任务)的突破性跨越,GLM-5.1
    的头像 发表于 04-08 17:14 609次阅读

    论马斯克的预言:AI使人类边缘化

    依据 马斯克认为AI已进入“递归式自我改进”阶段,新代的AI模型由上模型参与训练,
    发表于 03-14 05:27

    一分钟带你了解:导热硅脂

    、什么是导热硅脂导热硅脂,又叫导热膏,是种常用于电子设备散热系统中的关键材料。它的主要作用是填充CPU、GPU等发热元件与散热器之间的微小空隙,减少空气热阻,提高热传导效率。虽然它看起来只是
    的头像 发表于 02-05 17:28 908次阅读
    <b class='flag-5'>一分钟</b>带你了解:导热硅脂

    一分钟带你了解:导热胶

    、什么是导热胶在电子设备日益高性能化的今天,散热管理成为影响设备稳定运行的重要因素。除了我们熟知的导热硅脂和导热片,还有种常被用于工业和高端电子产品中的导热材料——导热胶。它不仅具备导热功能
    的头像 发表于 02-05 17:25 542次阅读
    <b class='flag-5'>一分钟</b>带你了解:导热胶

    一分钟带你了解:导热片

    、什么是导热片在电子设备日益高性能、小型化的今天,散热问题成为影响设备稳定运行的关键因素。除了导热硅脂和导热胶,还有种常被用于电脑、手机、LED灯具和新能源汽车等产品中的导热材料——导热片。它是
    的头像 发表于 02-05 17:10 744次阅读
    <b class='flag-5'>一分钟</b>带你了解:导热片

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    AI大家都很了解了吧;AGI是什么呢? AGI:通用人工智能,可以再各个应用领域都具备AI的处理能力。 AGI可以组成能够24小时连续工作的优秀员工队伍,他们拥有比人类更强的能力和领导
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第个范
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    连接定义了神经网络的拓扑结构。 不同神经网络的DNN: 、基于大模型AI芯片 1、Transformer 模型与引擎 1.1 Transformer
    发表于 09-12 17:30

    一分钟教程】用ZMC600E实现关节机器人±180度精准转动

    一分钟速览:从设备连接到编程控制,演示关节机器人的±180度精准转动。关节机器人±180度转动例程在科技高度发达今天,越来越多的智能机器人进入我们的日常生活中。究竟这些机器人是如何实现运动?工程师
    的头像 发表于 08-15 11:36 946次阅读
    【<b class='flag-5'>一分钟</b>教程】用ZMC600E实现关节机器人±180度精准转动

    晶众光电CW连续紫外激光器介绍

    它就是晶众光电今天要给大家介绍的“主角”—— CW连续紫外激光器 。小身材大能量,今天一分钟,带您看明白它凭啥成为精密制造的“全能助手”。
    的头像 发表于 08-05 14:48 1787次阅读

    先进封装中的RDL技术是什么

    前面分享了先进封装的四要素一分钟让你明白什么是先进封装,今天分享下先进封装四要素中的再布线(RDL)。
    的头像 发表于 07-09 11:17 5087次阅读
    先进封装中的RDL技术是什么

    先进封装中的TSV分类及工艺流程

    前面分享了先进封装的四要素一分钟让你明白什么是先进封装,今天分享下先进封装中先进性最高的TSV。
    的头像 发表于 07-08 14:32 4692次阅读
    先进封装中的TSV分类及工艺流程

    光纤光谱仪是什么?一分钟读懂它的原理与结构

    光纤光谱仪是什么?一分钟读懂它的原理与结构 在现代科学仪器中,光谱仪是分析光的重要工具。而光纤光谱仪,作为其中的种紧凑型分支,正在被广泛应用于环境监测、生物医疗、半导体制造、食品安全、材料分析等
    的头像 发表于 07-07 14:27 1339次阅读

    在IDE中运行固件内自带的AI程序,约2分钟左右就死机了,为什么?

    1、在IDE中运行固件内自带的AI程序,约2分钟左右就死机,点击停止报 繁忙,点连接也报 忙碌中。从资源管理器中点击CanMV可以访问下级文件夹。 2、过几分钟后在IDE中点击“连接
    发表于 06-06 07:28