0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!

CVer 来源:量子位(QbitAI) 2023-09-20 17:34 次阅读

大模型之争,又卷起来了。

据The information爆料称,OpenAI即将推出多模态模型GPT-vision。

如果消息为真,这将是OpenAI在GPT-4之后推出的最大更新。

另一边,谷歌的多模态模型进展也在最近传出,为的就是能和OpenAI抗衡。

02048bbc-5774-11ee-939d-92fbcf53809c.png

目前为止,OpenAI还没有对爆料中的传闻做出回应,但此前发布过多模态模型测试。

CEO奥特曼在回应有关GPT-5的传闻时,也暗示过GPT-4“正在增强”。

究竟谁能更胜一筹,还得让子弹再飞一会儿。

不能让Google抢了先

我们先回到OpenAI,被爆料的多模态模型将搭载什么样的功能呢?

首先是图像内容识别,比如根据手绘草图生成网页代码、输出可视化图表的文本分析等。

另一方面则是图像生成,通过简单的文本生成绘画、logo或表情包。

虽然OpenAI没有对这次的爆料做出回应,但做多模态模型这件事本身只是个时间问题。

3月份,OpenAI在发布GPT-4时,就曾推出了一个多模态GPT的预览版本。

当时,OpenAI把DEMO提供给了研究帮助视障群体的机构Be My Eyes。

除了这家机构之外,就再也没有人见过OpenAI的多模态模型是什么样子了。

023532ee-5774-11ee-939d-92fbcf53809c.png

在此之后,这个多模态模型更是杳无音讯。

唯一和图像有点关系的,就是GPT-4的升级版代码解释器(后改名为高级数据分析)可以处理一些图片任务。

但这是通过调用Python库实现的,而且也达不到AI中图像识别的程度,和多模态模型更是不沾边了。

02438dc6-5774-11ee-939d-92fbcf53809c.png

有说法称GPT-vision迟迟没有推出的原因可能是对安全的担忧,担心被用于破解验证码和人脸识别系统。

直到这次Google多模态模型Gemini的消息传出。

025abb72-5774-11ee-939d-92fbcf53809c.png

安全问题有没有解决不得而知,但也许OpenAI是真的急了,不能任由谷歌超越,才有了模型发布的传闻。

另据爆料,OpenAI还在准备从头开始开发一个名为Gobi的多模态模型,不过训练还未开始。

那么,谷歌这边的情况又是怎样的呢?

Gemini来势汹汹

来势汹汹的Gemini,让网友直言其或将成为游戏规则的改变者。

026ce810-5774-11ee-939d-92fbcf53809c.png

甚至有媒体夸张一些地说将有机会取代GPT-4。

0282117c-5774-11ee-939d-92fbcf53809c.png

Gemini主要由谷歌DeepMind团队开发。谷歌CEO皮查伊介绍,Gemini集成了多种技术,支持同时输出文本和图像,还可以使用工具和API

据悉,Gemini吸取了很多来自AlphaGo的经验教训,包括强化学习和树搜索技术。

而且,凭借着拥有YouTube这一得天独厚的优势,海量的训练数据可以说是唾手可得。

实际上,Google也一直把OpenAI视为竞争对手。

为了和ChatGPT较量,Google此前已经在Bard中加入过图像识别功能,但并未改变ChatGPT的地位。

但这次推出的Gemini,OpenAI也感到害怕了。

尽管竞争激烈,有一点倒是让谷歌和OpenAI不谋而合。

那就是,把模型的能力变成真金白银。

谷歌计划的Gemini提供方式是通过其Google Cloud Vertex AI云服务平台进行,预期价格为每个用户每月30美元。

这一做法预计将成为谷歌新的收入来源,尤其是针对企业客户。

而OpenAI这边,也已经开始通过金融服务等各种应用程序将GPT-4变为现金。

此次多模态的角逐究竟鹿死谁手,我们拭目以待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47685
  • python
    +关注

    关注

    51

    文章

    4675

    浏览量

    83466
  • OpenAI
    +关注

    关注

    8

    文章

    757

    浏览量

    5911

原文标题:OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤科技发布5.0多模态模型,综合能力全面对标GPT-4 Turbo

    场景应用需求;升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。 此外对于文生视频徐立也表示商汤科技很快就会发布相关的平台产品。 备受瞩目的商汤科技“日日新SenseNova” 5.0多
    的头像 发表于 04-24 16:49 449次阅读

    微软Copilot全面更新为OpenAIGPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级GPT-4取得显著进步,如今再次更新至性能卓越的GP
    的头像 发表于 03-13 13:42 248次阅读

    OpenAI推出ChatGPT新功能:朗读,支持37种语言,兼容GPT-4GPT-3

    据悉,“朗读”功能支持37种语言,且能够自主识别文本类型并对应相应的发音。值得关注的是,该功能对GPT-4以及GPT-3.5版本的ChatGPT均适用。此举彰显了OpenAI致力于“多模态
    的头像 发表于 03-05 15:48 277次阅读

    ChatGPT plus有什么功能?OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能

    OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能分析解答 在最近的OpenAI DevDay上,该组织发布了一项备受期待的公告:推出GPT-4 Turbo,这是对其突破
    的头像 发表于 12-13 09:19 602次阅读
    ChatGPT plus有什么功能?<b class='flag-5'>OpenAI</b> 发布 <b class='flag-5'>GPT-4</b> Turbo 目前我们所知道的功能

    OpenAI发布的GPT-4 Turbo版本ChatGPT plus有什么功能?

    OpenAIGPT-4 Turbo以前所未有的功能和价格改变人工智能的未来 在人工智能领域的一次里程碑式活动中,OpenAI开发者大会上发布了GPT-4 Turbo,这是突破性人工智
    的头像 发表于 12-05 17:57 1458次阅读
    <b class='flag-5'>OpenAI</b>发布的<b class='flag-5'>GPT-4</b> Turbo版本ChatGPT plus有什么功能?

    OpenAI发生严重故障 GPT-4 Turbo模型太火爆 ChatGPT停服两小时

    OpenAI发生严重故障 ChatGPT停服两小时 就在前两天OpenAI首届开发者大会广受关注,OpenAI才发布了超级重磅的更新,发布了GPT-4 Turbo
    的头像 发表于 11-09 15:35 804次阅读

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3 目前OpenAI算是全球大模型的引领者,一举一动都牵动着大
    的头像 发表于 11-07 18:20 2159次阅读
    ChatGPT重磅更新 <b class='flag-5'>OpenAI</b>发布<b class='flag-5'>GPT-4</b> Turbo<b class='flag-5'>模型</b>价格大降2/3

    GPT-4没有推理能力吗?

    今年三月,OpenAI 重磅发布了 GPT-4模型,带来了比 ChatGPT 背后 GPT-3.5 更强的推理、计算、逻辑能力,也引发了全民使用的热潮。在各行各领域研究人员、开发者
    的头像 发表于 08-11 14:20 671次阅读
    <b class='flag-5'>GPT-4</b>没有推理能力吗?

    OpenAI已为GPT-5申请商标,GPT-5要来了?

    OpenAI 此前曾在前几代模型(例如 GPT-4GPT-3.5)的商标申请中,使用过同样的“用于使用语言模型的可下载计算机软件”这一
    的头像 发表于 08-02 15:51 472次阅读
    <b class='flag-5'>OpenAI</b>已为<b class='flag-5'>GPT</b>-5申请商标,<b class='flag-5'>GPT</b>-5要来了?

    GPT-3.5 vs GPT-4:ChatGPT Plus 值得订阅费吗 国内怎么付费?

    每月20美元)更智能、更准确。 OpenAIGPT-4描述为“比其前身GPT-3.5先进10倍”。 自从OpenAI的大语言模型(LLM)
    的头像 发表于 08-02 12:09 2997次阅读
    <b class='flag-5'>GPT</b>-3.5 vs <b class='flag-5'>GPT-4</b>:ChatGPT Plus 值得订阅费吗 国内怎么付费?

    OpenAI宣布GPT-4 API全面开放使用!

    OpenAI 在博客文章中写道:“自 3 月份以来,数百万开发者请求访问 GPT-4 API,并且利用 GPT-4 的创新产品范围每天都在增长。” “我们设想基于对话的模型未来可以支持
    的头像 发表于 07-12 14:55 878次阅读

    GPT-4处于一个什么样的编码地位

      面试环节第一步——回答问题,写软件需求 面试环节第二步——上手写代码 测试用例   比 ChatGPT 背后 GPT-3.5 更为强大的模型 GPT-4,已正式对外发布。在 OpenAI
    的头像 发表于 06-16 10:42 434次阅读
    <b class='flag-5'>GPT-4</b>处于一个什么样的编码地位

    最新、最强大的模型GPT-4将向美国政府机构开放

    最新、最强大的模型GPT-4将向美国政府机构开放 此前微软已向其商业客户提供了OpenAI模型,现在微软宣布将向azure government云计算客户开放
    的头像 发表于 06-08 20:15 1216次阅读

    GPT-4模型结构和训练方法

    GPT-4 的发布报道上,GPT-4 的多模态能力让人印象深刻,它可以理解图片内容给出图片描述,甚至能在图片内容的基础上理解其中的隐喻或推断下一时刻的发展。
    的头像 发表于 05-22 15:21 2005次阅读
    <b class='flag-5'>GPT-4</b> 的<b class='flag-5'>模型</b>结构和训练方法

    微软GPT-4搜索引擎重大升级 新Bing开放AI能力

    微软GPT-4搜索引擎重大升级 新Bing开放AI能力 微软和OpenAI合作将人工智能技术应用于必应搜索带来了更多不一样的搜索体验。 此前Open AI发布了新一代大型人工智能语言训练模型
    的头像 发表于 05-05 17:15 2239次阅读