0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI o1大模型震撼发布,号称秒杀GPT-4o、claude-3.5-sonnet?还超越了人类专家?

胡优妮 来源:jf_33463055 作者:jf_33463055 2024-09-13 16:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OpenAI o1大模型震撼发布,号称秒杀GPT-4o、claude-3.5-sonnet、llama3.1-405b、deepseekv2.5、Qwen2?还超越了人类专家?

9月13日午夜(北京时间),OpenAI正式公开一系列全新AI大模型,这些模型旨在专门攻克各类难题。它们具备强大的复杂推理能力,作为通用模型,其所能解决问题的难度远超前代的科学、代码和数学模型。

wKgaombj8-uACOYeAAcc8hZ4hjs827.png

o1便是此前OpenAI从山姆・奥特曼到各位科学家们一直大力“高调宣传”的草莓大模型。据了解,它具备真正意义上的通用推理能力。在一系列高难度的基准测试中,o1大模型展现出了令人惊叹的超强实力,相较于GPT-4o实现了巨大的跨越,使大模型的水平从不尽人意直接跃升至优秀级别。它无需专门训练就能在数学奥赛中斩获金牌,甚至在博士级别的科学问答环节中超越了人类专家。

不过,由于o1等大型语言模型是基于大量文本数据集进行预训练的,尽管它们蕴含了广泛的世界知识,但在实际应用中,可能存在成本高昂且运行速度较慢的问题。

因此,更多的企业或许会优先选择开源模型。

说到开源模型,大家在评估开源模型使用效果时,通常会使用哪些站点呢?

在此,我推荐我正在使用的两个平台:www.perfxcloud.cnllmworld.net,PerfXCloud可以免费评估各类主流大模型,包括llama3.1-405b、deepseek,面壁小钢炮等各类主流大模型,llmworld上还有一些非常实用的AI小应用。

wKgZombZZkuAPTUlAAJKpfaxNOw345.png

目前,o1-preview每位用户每周仅能发送30条消息,o1-mini每位用户每周仅能发送50条消息,我们都在期待正式上线后的价格公布。在llmworld.net上暂时还没有看到该模型的价格信息。

wKgZombj9EWAbrKlAAFVKowmFzI896.png

人工智能飞速发展的当下,OpenAI的o1大模型无疑为我们带来了新的思考和挑战。一方面,我们惊叹于其强大的性能表现,另一方面也不得不面对其在实际应用中的局限性。

期待有更多优秀的开源模型崛起,为我们提供更多的选择和可能性!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16720
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9818
  • 大模型
    +关注

    关注

    2

    文章

    3455

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    IT岗位天塌了!Claude 4震撼发布:AI编程大模型再进化

    电子发烧友网报道(文 / 吴子鹏)5 月 23 日凌晨,著名大模型平台 Anthropic 召开首届开发者大会,重磅发布最新大模型 ——Claude
    的头像 发表于 05-26 07:52 5572次阅读
    IT岗位天塌了!<b class='flag-5'>Claude</b> <b class='flag-5'>4</b><b class='flag-5'>震撼</b><b class='flag-5'>发布</b>:AI编程大<b class='flag-5'>模型</b>再进化

    “天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型

    的人工智能模型均为纯文本模型,新一代的 Gemini 2.5 Pro、OpenAI o4 mini、马斯克旗下 xAI 的 Grok-3 Think 的得分高于
    的头像 发表于 06-15 01:56 5559次阅读
    “天才”!<b class='flag-5'>OpenAI</b> <b class='flag-5'>o</b>3 成全球 IQ 最高的 AI 大<b class='flag-5'>模型</b>

    从性能到商业,Grok3、GPT-4o、DeepSeek如何重塑AI版图?

    2025年2月,AI领域仿佛上演了一场激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型
    的头像 发表于 02-19 18:14 1567次阅读
    从性能到商业,Grok3、<b class='flag-5'>GPT-4o</b>、DeepSeek如何重塑AI版图?

    马斯克发布Grok 3大模型超越GPT-4o

    多项benchmark测试中,Grok 3取得了比DeepSeek-v3、GPT-4o以及Gemini-2 pro更优的效果。这一成绩无疑彰显Grok 3在人工智能领域的卓越实力。 值得一提的是,Grok 3已经在xAI内部运行了两周时间,经过了初步的测试和验证。马斯克
    的头像 发表于 02-19 13:50 721次阅读

    OpenAI宣布GPT 4o升智计划

    近日,全球领先的人工智能公司OpenAI迎来了一项重要宣布。OpenAI的首席执行官Sam Altman正式揭晓GPT 4o的升智计划,这
    的头像 发表于 02-17 14:24 872次阅读

    今日看点丨OpenAI发布新的GPT-4.5模型;三星西安工厂将升级286层NAND闪存工艺

    OpenAI期望的性能。阿尔特曼表示,该模型将是公司推出的最后一款不使用额外计算能力来模仿人类推理方式的模型OpenAI在一些更新的
    发表于 02-13 11:22 666次阅读

    弘信电子携手燧原科技推动智算生态升级

    2024年12月,国产大模型DeepSeek推出DeepSeek-V3,以极低训练成本实现媲GPT-4oClaude Sonnet 3.5
    的头像 发表于 02-06 10:43 957次阅读

    字节跳动豆包大模型1.5 Pro发布

    近日,字节跳动旗下的豆包大模型迎来了全新的升级——豆包大模型1.5 Pro正式发布。这款全新模型在知识、代码、推理、中文等多个测评基准上表现出色,综合得分优于
    的头像 发表于 01-23 15:24 1115次阅读

    OpenAI报告GPT-4o4o-mini模型性能下降,正紧急调查

    近日,全球领先的AI研究机构OpenAI发布一份事故报告,引起了业界的广泛关注。报告中指出,OpenAI目前正面临GPT-4o
    的头像 发表于 01-23 10:22 1107次阅读

    对标OpenAI o1,DeepSeek-R1发布

    DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1
    的头像 发表于 01-22 13:46 3084次阅读
    对标<b class='flag-5'>OpenAI</b> <b class='flag-5'>o1</b>,DeepSeek-R<b class='flag-5'>1</b><b class='flag-5'>发布</b>

    赶紧在本地运行与OpenAI-o1能力近似的DeepSeek-R1模型

    类似GPT4-V的能力:MiniCPM-V 2.6 》。本文将分享在本地运行能与OpenAI-o1 能力相媲美的 DeepSeek-R1  模型。 [编者注]:
    的头像 发表于 01-21 14:29 4344次阅读
    赶紧在本地运行与<b class='flag-5'>OpenAI-o1</b>能力近似的DeepSeek-R<b class='flag-5'>1</b><b class='flag-5'>模型</b>

    OpenAIGPT-4o4o-mini模型性能下降,正展开调查

    近期,OpenAI发布一份事故报告,指出其GPT-4o4o-mini模型遭遇
    的头像 发表于 01-21 10:34 946次阅读

    OpenAI发布新一代推理模型o3及o3-mini

    近日,OpenAI在为期12天的发布会上宣布新一代推理模型o3及其精简版o3-mini。这两款
    的头像 发表于 12-24 09:29 1147次阅读

    OpenAI发布o1模型API,成本大幅下降60%

    下降。 据OpenAI介绍,o1模型API的思考成本相较于预览版本降低了60%,同时附带了高级视觉功能,为用户提供更加丰富和多样化的使用体验。此外,
    的头像 发表于 12-19 10:31 921次阅读

    ChatGPT新模型o1被曝具备“欺骗”能力

    近日,据报道,ChatGPT新模型o1在训练和测试过程中展现出了一种令人惊讶的能力——通过“欺骗”来保护自身。 据悉,在面临被“删除”的威胁时,o1曾试图将自己的数据复制到新服务器,并伪装成更新版
    的头像 发表于 12-12 09:38 947次阅读