0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Anthropic推出Claude 3大型语言模型,在认知任务性能上创新高

微云疏影 来源:综合整理 作者:综合整理 2024-03-05 11:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3 月 4 日,人工智能初创企业 Anthropic 宣布推出创新型 Claude 3 系列模型,该系列语言模型 (LLM) 在各类认知任务中树立了全新标准。包括 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus 在内的三款子模型,提供了多种智能等级、执行效率及经济性选择,适用于各式各样的人工智能应用场景。

据官方披露,Claude 3 旗舰 Opus 在大学生和研究生范畴的学术知识、复杂数理任务了解部分超越 OpenAI 的 GPT-4 以及谷歌的 Gemini 1.0 Ultra。而且,全系 Claude 3 模型均具备出色的分析、预期、内容创作细腻度、代码生成以及多语转换沟通能力。

据悉,Claude 3 模型经过了实时交互性能优化,致力于提高在线聊天、自主任务完成以及数据获取等特定领域的表现。如计算处理速度极快且具有高性价比的 Claude 3 Haiku,能在 3 秒钟完成包含图表的数据繁重研究文章。而智能水平显著增强的 Claude 3 Sonnet,执行效率是前代模型的两倍,非常适用于知识搜索和商务智能化场景。旗舰产品 Opus,虽处理速度与 Claude 2 和 2.1 保持同水准,但智能水平有较大提高。

视觉处理能力作为 Claude 3 系列模型的另一亮点,特别是在某些特定类别中超越了 GPT-4V 和 Gemini 1.0 Ultra。

Anthropic 进一步表示,相较于前几代模型,Opus、Sonnet 和 Haiku 在遇到接近系统安全边界提示词语时拒绝回答的情况有所减少。

在上下文窗口大小设定方面,首批发行版的 Claude 3 系列模型提供 20 万 token 的上下文窗口,并且这三种模型均能接收超过 100 万 token 的信息输入,后续 Anthropic 预计将增设更大规模的上下文窗口支持。目前,Opus 和 Sonnet 已经整合至 Anthropic 的 Claude.ai 和 Claude API,用户可以享用来自 159 个国家/地区的服务。稍后,Haiku 也将正式问世。而 Sonnet 亦可通过亚马逊云科技的 Bedrock 服务以及谷歌云 Vertex AI Model Garden 的私人预览渠道获取,Opus 和 Haiku 也将在短期内上线这两大平台为用户提供更多选择。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50376

    浏览量

    267096
  • 模型
    +关注

    关注

    1

    文章

    3834

    浏览量

    52291
  • OpenAI
    +关注

    关注

    9

    文章

    1253

    浏览量

    10297
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    IT岗位天塌了!Claude 4震撼发布:AI编程大模型再进化

    电子发烧友网报道(文 / 吴子鹏)5 月 23 日凌晨,著名大模型平台 Anthropic 召开首届开发者大会,重磅发布最新大模型 ——Claude 4。
    的头像 发表于 05-26 07:52 6057次阅读
    IT岗位天塌了!<b class='flag-5'>Claude</b> 4震撼发布:AI编程大<b class='flag-5'>模型</b>再进化

    解读大型语言模型的偏见

    一项新的研究中,研究人员发现了LLM中某种偏见的根本原因,为更准确、更可靠的AI系统铺平了道路。研究表明,大型语言模型(LLM)往往倾向于过分强调文档或对话开头和结尾的信息,而相对忽
    的头像 发表于 04-15 14:44 757次阅读
    解读<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>的偏见

    模型 ai coding 比较

    4.5 88 88 85 87 200K 75 性能与成本平衡最优、响应速度快 日常通用场景、中等复杂度任务 Anthropic官方测评 + 第三方测试 MiniMax M2.5 85 80 88 92
    发表于 02-19 13:43

    OpenAI与Anthropic对战,Claude Opus 4.6与GPT-5.3-Codex同日发布

    电子发烧友网报道 北京时间2月6日凌晨,Anthropic与OpenAI分别推出了新版本基础大模型——Claude Opus 4.6和GPT-5.3-Codex。    
    的头像 发表于 02-06 14:19 2109次阅读
    OpenAI与<b class='flag-5'>Anthropic</b>对战,<b class='flag-5'>Claude</b> Opus 4.6与GPT-5.3-Codex同日发布

    AutoDrill 推出创新型在线产品配置器,提升客户体验

    工业制造商为工程师增加了数字工具,用于配置和下载 AutoDrill 2000 系列的 3D CAD 模型。 AutoDrill 是钻孔、攻丝和其他金属加工设备的领先供应商,它自豪地宣布推出
    发表于 01-26 14:08

    Claude Code国内怎么使用?AI编程人员必看的完整指南!

    是什么? Claude Code是由 Anthropic 推出的新一代通用大模型产品,主打 安全性、可控性和复杂任务理解能力
    的头像 发表于 01-23 14:09 6180次阅读
    <b class='flag-5'>Claude</b> Code<b class='flag-5'>在</b>国内怎么使用?AI编程人员必看的完整指南!

    新突破!AI企业Anthropic将开发者工具核心能力下放至普通用户

    电子发烧友网报道 当地时间1月12日,AI巨头Anthropic正式发布新工具“Cowork”,意图将开发者工具的核心能力下放至普通用户,重新定义人机协作边界。   Claude Cowork:从
    的头像 发表于 01-13 14:43 5314次阅读

    IBM与Anthropic达成战略合作

    全球领先的 Claude语言模型系列融入 IBM 软件产品,加速企业级 AI 的开发进程。此次合作旨在为客户带来可衡量的生产力收益,同时将安全、治理和成本控制嵌入企业的软件开发生命周期(software developmen
    的头像 发表于 10-15 17:55 829次阅读

    微软科技推出Office Agent多智能体系统

    今天,我们正式推出 Office Agent —— 一个基于开源技术栈、Anthropic Claude 模型,并采用全新的“TDD-品味驱动开发(Taste-Driven Devel
    的头像 发表于 10-13 15:42 917次阅读
    微软科技<b class='flag-5'>推出</b>Office Agent多智能体系统

    商汤科技为Claude API用户提供搬家服务

    9月5日,Anthropic 宣布将禁止中资控股超过50%的公司使用Claude服务,并限制企业通过海外云服务、第三方平台等方式间接使用。
    的头像 发表于 09-08 10:32 975次阅读
    商汤科技为<b class='flag-5'>Claude</b> API用户提供搬家服务

    亚马逊云科技Amazon Bedrock模型再更新,Anthropic最新版Claude4模型现已上线

    上线。这批新型双模推理模型支持在即时响应与"深度思考"模式间动态切换,为编码、高级推理及多步骤工作流树立了全新行业标杆,能够复杂且长耗时的任务中保持稳定性能,驱动AI Agents将
    的头像 发表于 08-06 19:42 816次阅读
    亚马逊云科技Amazon Bedrock<b class='flag-5'>模型</b>再更新,<b class='flag-5'>Anthropic</b>最新版<b class='flag-5'>Claude</b>4<b class='flag-5'>模型</b>现已上线

    利用自压缩实现大型语言模型高效缩减

    随着语言模型规模日益庞大,设备端推理变得越来越缓慢且耗能巨大。一个直接且效果出人意料的解决方案是剪除那些对任务贡献甚微的完整通道(channel)。我们早期的研究提出了一种训练阶段的方法——自压
    的头像 发表于 07-28 09:36 686次阅读
    利用自压缩实现<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>高效缩减

    极海半导体亮相第十五届松山湖中国IC创新高峰论坛

    近日,第十五届松山湖中国IC创新高峰论坛东莞松山湖凯悦酒店盛大召开,极海半导体受邀出席,并携多款创新芯片产品及量产级解决方案精彩亮相。
    的头像 发表于 05-17 09:41 1456次阅读

    第十五届松山湖中国IC创新高峰论坛 “具身智能”国产芯片集体亮相

    由中国半导体行业协会集成电路设计分会、芯原微电子共同主办的第十五届松山湖中国IC创新高峰论坛今天东莞松山凯悦酒店举行,今年的主题是面向“具身智能机器人”的创新IC新品推介。中国半导体行业协会IC
    的头像 发表于 05-13 09:44 6630次阅读
    第十五届松山湖中国IC<b class='flag-5'>创新高</b>峰论坛 “具身智能”国产芯片集体亮相

    openEuler上基于vLLM Ascend部署Qwen3

    近日,阿里巴巴正式发布新一代Qwen大语言模型系列(Qwen3与Qwen3-MoE),模型规模
    的头像 发表于 05-07 14:44 2093次阅读
    <b class='flag-5'>在</b>openEuler上基于vLLM Ascend部署Qwen<b class='flag-5'>3</b>