0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI正式发布GPT-4:支持图像和文本的输入、 处理中文的准确度大幅提升

OSC开源社区 来源:OSC开源社区 2023-03-16 09:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OpenAI 刚刚宣布正式推出GPT-4。GPT-4 是 Generative Pre-trained Transformer 4 的缩写,即生成型预训练变换模型 4。

公告写道,GPT-4 是一个多模态大型语言模型(支持接受图像和文本输入,以文本形式输出),也是 OpenAI 努力扩展深度学习的最新里程碑。虽然 GPT-4 对于许多现实场景的处理比人类差,但它在各种体现专业和学术能力的 benchmark 上,已表现出和人类相当的水平。 例如,GPT-4 通过了模拟律师考试,其分数在应试者的前 10% 左右;相比之下,GPT-3.5 的得分却在倒数 10% 左右。OpenAI 表示,他们花了 6 个月的时间来使用对抗性测试程序,以及通过 ChatGPT 的经验教训迭代调整 GPT-4,从而在真实性和可控性等方面取得了有史以来最好的结果(尽管远非完美)。 使用示例 OpenAI 用一张梗图演示了 GPT-4 特有的「多模态」功能。 用户提问:解释下图的笑点是什么,并对图片中的每部分进行描述。

7be7e048-c37a-11ed-bfe3-dac502259ad0.png

GPT-4:

The image shows a package for a "Lightning Cable" adapter with three panels. Panel 1: A smartphone with a VGA connector (a large, blue, 15-pin connector typically used for computer monitors) plugged into its charging port. Panel 2: The package for the "Lightning Cable" adapter with a picture of a VGA connector on it. Panel 3: A close-up of the VGA connector with a small Lightning connector (used for charging iPhones and other Apple devices) at the end. The humor in this image comes from the absurdity of plugging a large, outdated VGA connector into a small, modern smartphone charging port.

翻译如下:

图片显示了一个 "Lightning Cable" 适配器的包装,总共包含三个部分。 面板 1:一部智能手机,其充电端口插着一个 VGA 接口(大的蓝色 15 针接口,通常用于电脑显示器)。 面板 2:"Lightning Cable" 适配器的包装上有一张 VGA 接口的图片。 面板 3:VGA 连接器的特写,末端是一个小的 Lightning 连接器(用于为 iPhone 和其他苹果设备充电)。 这张图片的笑点来自于:展示了将一个大的、过时的 VGA 连接器插入一个小的、现代的智能手机充电端口的荒谬性。

上面的例子看起来很简单,OpenAI 紧接着展示了高级用法 —— 像人类一样读论文。简单来说就是给 GPT-4 提供论文的图片格式文件,让它阅读并总结出要点。效果如下:

7c40c0c8-c37a-11ed-bfe3-dac502259ad0.png

甚至直接让 GPT-4 回答图片中对应题号的问题:

7c847912-c37a-11ed-bfe3-dac502259ad0.png

GPT-4 局限性 尽管功能强大,但 GPT-4 与早期的 GPT 模型具有相似的局限性,即生成的结果不符合事实。因此它仍然不完全可靠(它会产生 “幻觉” 事实并出现推理错误)。 虽然这仍然是一个问题,但 GPT-4 相对于以前的模型(它们本身在每次迭代中都在改进)显着减少了 “幻觉”。在内部的对抗性真实性评估中,GPT-4 的得分比最新的 GPT-3.5 高 40%:

7c8f1fd4-c37a-11ed-bfe3-dac502259ad0.png

与 GPT 3.5 的对比 据介绍,对于日常的谈话,GPT-3.5 和 GPT-4 之间的区别可能很微妙。但当任务的复杂性达到足够的阈值时,差异就会出现 ——GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。 为了了解这两种模型之间的区别,OpenAI 通过各种 benchmark 进行了测试,包括最初为人类设计的模拟考试。从下图可以看出,GPT-4 的成绩大部分都比 GPT-3 好。

7caa4a52-c37a-11ed-bfe3-dac502259ad0.png

GPT-4 也在多项测试项目中取得了接近满分的成绩:

USABO Semifinal Exam 2020(美国生物奥林匹克竞赛)

GRE 口语

OpenAI 还将机器学习模型的传统 benchmark 用于评估 GPT-4。结果显示,GPT-4 已经远远超过现有的大型语言模型,以及大多数最先进的 (SOTA, state-of-the-art) 模型。benchmark 数据如下:

7cb4a484-c37a-11ed-bfe3-dac502259ad0.png

在 MMLU benchmark 中(一个基准数据集,包括来自于 STEM、人文、社科等 57 个学科的选择题,它用于测试 LLM 的世界知识和问题解答的能力),GPT-4 处理中文的准确度大约是 80%,已经优于其他 LLM 的英文表现,比如 GPT-3.5、Chinchilla、PALM。

7cd1d25c-c37a-11ed-bfe3-dac502259ad0.png

试用方式

ChatGPT Plus 订阅用户可尝鲜体验,他们将在 chat.openai.com 上获得具有使用s上限的 GPT-4 访问权限。

调用 API,访问
https://openai.com/waitlist/gpt-4进入等待名单


另外,

现在只支持纯文本的请求(图像输入还在 alpha 阶段)

定价:prompt - $0.03 per 1k token, completion - $0.06 per 1k token

context 长度为 8192 tokens,并且提供 32768 token 的版本(价格也更贵,$0.06 & $0.12)

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1096

    浏览量

    42438
  • 模型
    +关注

    关注

    1

    文章

    3819

    浏览量

    52270
  • OpenAI
    +关注

    关注

    9

    文章

    1250

    浏览量

    10281

原文标题:OpenAI正式发布GPT-4:支持图像和文本的输入、 处理中文的准确度大幅提升

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5震撼发布:AI领域的重大飞跃

    电子发烧友网报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,
    的头像 发表于 08-09 07:44 1w次阅读
    <b class='flag-5'>GPT</b>-5震撼<b class='flag-5'>发布</b>:AI领域的重大飞跃

    电能表CSA认证,为什么不做准确度检测?

    CSA确保的是“安全”二字,而计量准确度,则属于另一片认证的天地。
    的头像 发表于 03-26 14:41 708次阅读
    电能表CSA认证,为什么不做<b class='flag-5'>准确度</b>检测?

    OpenAI与Anthropic对战,Claude Opus 4.6与GPT-5.3-Codex同日发布

    GPT-5.2在内的众多竞争对手。   新模型首次拥有100万token的上下文窗口,极大提升了AI处理和推理信息的能力。同时,Anthropic在Claude Code中引入类似Kimi K2.
    的头像 发表于 02-06 14:19 2060次阅读
    <b class='flag-5'>OpenAI</b>与Anthropic对战,Claude Opus 4.6与<b class='flag-5'>GPT</b>-5.3-Codex同日<b class='flag-5'>发布</b>

    GPT-5.1发布 OpenAI开始拼情商

    OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI发布
    的头像 发表于 11-13 15:49 820次阅读

    电能质量在线监测装置的谐波测量准确度受哪些因素影响?

    电能质量在线监测装置的谐波测量准确度,是硬件性能、算法设计、外部环境、运维管理等多因素共同作用的结果,任何一个环节的偏差都可能导致测量误差。以下从 硬件核心组件、算法处理逻辑、外部干扰环境、运维管理
    的头像 发表于 10-15 16:55 967次阅读

    电磁干扰对电能质量在线监测装置的精度等级和准确度有哪些具体影响?

     电磁干扰(EMI)是影响电能质量在线监测装置 精度等级稳定性 和 测量准确度 的核心环境因素之一,其影响通过干扰装置内部硬件电路、信号传输链路及数据处理过程实现,最终直接反映在关键测量参数的偏差上
    的头像 发表于 09-18 10:29 1450次阅读
    电磁干扰对电能质量在线监测装置的精度等级和<b class='flag-5'>准确度</b>有哪些具体影响?

    电能质量在线监测装置的精度等级和准确度的关系是否受测量参数的影响?

    电能质量在线监测装置的精度等级和准确度的关系 会显著受测量参数影响 ,核心原因在于:不同电能质量参数(如电压有效值、谐波、闪变、暂升 / 暂降)的 测量原理复杂、硬件依赖、算法要求 存在本质差异
    的头像 发表于 09-12 10:02 842次阅读
    电能质量在线监测装置的精度等级和<b class='flag-5'>准确度</b>的关系是否受测量参数的影响?

    环境因素对电能质量在线监测装置的精度等级和准确度的影响程度有多大?

    环境因素对电能质量在线监测装置的影响程度,核心体现为准确度偏离标称精度等级的 “量化幅度”—— 在标准规定的环境范围内(如 IEC 61000-4-30、GB/T 19862-2016),影响通常
    的头像 发表于 09-11 18:01 1177次阅读
    环境因素对电能质量在线监测装置的精度等级和<b class='flag-5'>准确度</b>的影响程度有多大?

    电能质量在线监测装置的精度等级和准确度的关系是否受环境因素影响?

    电能质量在线监测装置的精度等级和准确度的关系 会受环境因素显著影响 ,核心原因在于:环境因素虽不改变精度等级本身(固定的出厂标称),但会直接改变准确度(实际测量偏差),进而打破 “精度等级作为准确度
    的头像 发表于 09-11 17:34 1043次阅读
    电能质量在线监测装置的精度等级和<b class='flag-5'>准确度</b>的关系是否受环境因素影响?

    电能质量在线监测装置的精度等级与准确度的关系

    要理解电能质量在线监测装置(以下简称 “监测装置”)的 精度等级 与 准确度 的关系,需先明确两者的核心定义,再从 “设计目标 - 实际表现”“条件性 - 验证性” 两个维度拆解其关联与差异,最终
    的头像 发表于 09-11 17:29 1517次阅读
    电能质量在线监测装置的精度等级与<b class='flag-5'>准确度</b>的关系

    NVIDIA从云到边缘加速OpenAI gpt-oss模型部署,实现150万TPS推理

      自 2016 年推出 NVIDIA DGX 以来,NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。此次 OpenAI gpt-oss-20b 和 gpt-oss-
    的头像 发表于 08-15 20:34 2500次阅读
    NVIDIA从云到边缘加速<b class='flag-5'>OpenAI</b> <b class='flag-5'>gpt</b>-oss模型部署,实现150万TPS推理

    OpenAI或在周五凌晨发布GPT-5 OpenAI以低价向美国政府提供ChatGPT

    外界一直在期待的OpenAI新一代大语言模型GPT-5或将发布。据外媒的报道,GPT-5很可能在周五凌晨发布。这是
    的头像 发表于 08-07 14:13 1.5w次阅读

    OpenAI发布2款开源模型

    OpenAI开源了两款高性能权重语言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt
    的头像 发表于 08-06 14:25 1149次阅读

    关于CAPSENSE™每个 Vref 电压的准确度的疑问求解

    我认为CAPSENSE™在感应电容时使用 Vref 电压值。 根据组件数据表,Vref 电压值根据 VDDA 设置而变化。 PSoC™ 4 电容式感应 ( CAPSENSE™ ) 您能否告诉我们每个 Vref 电压(从 1.2V 到 2.743V)的准确度
    发表于 07-15 07:35

    电工仪表准确度等级详解

    一、准确度等级的定义 以下是“JJF1001-2011通用计量术语”对准确度准确度等级的相关定义: 1、测量准确度 measurement accuracy,sccuracy
    的头像 发表于 05-19 10:20 6033次阅读
    电工仪表<b class='flag-5'>准确度</b>等级详解