0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta推出最强开源模型Llama 3 要挑战GPT

A面面观 2024-04-19 17:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Meta推出最强开源模型Llama 3 要挑战GPT

Facebook母公司Meta Platforms(META.US)推出了开源AI大模型“Llama”的最新升级版本“Llama 3”,Meta公司这次开源了Llama 3 8B与70B两款不同规模的模型,开发者可以免费使用,而Meta公司还将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型。

据悉Meta用搭载超2.4万块H100芯片的计算机集群训练Llama 3。Llama 3最大参数规模超4000亿,训练token超15万亿,训练数据规模差不多是Llama 2的七倍。而且训练效率比Llama 2高3倍;同时在安全性也有非常明显的进步。对比GPT-3.5多种人类评估测评胜率超六成。

基于Llama 3模型目前已经覆盖Instagram、WhatsApp、Facebook等Meta公司的应用软件。

OpenAI的核心创始成员之一、特斯拉前AI总监Andrej Karpathy认为400B Llama3性能已接近GPT-4 的水平。

Meta首席产品官考克斯表示Llama 3在它参数模型的许多基准上都处于行业领先地位。

有业界分析师认为开源大模型Llama 3期待已久,Meta公司肯定非常希望Llama3能够超越OpenAI的GPT-4。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Meta
    +关注

    关注

    0

    文章

    316

    浏览量

    12326
  • ChatGPT
    +关注

    关注

    30

    文章

    1596

    浏览量

    10066
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4960
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【VisionFive 2单板计算机试用体验】3开源大语言模型部署

    1、ollama平台搭建 ollama可以快速地部署开源模型,网址为https://ollama.com, 试用该平台,可以在多平台上部署 Deepseek-R1, Qwen3, Llama
    发表于 07-19 15:45

    使用 NPU 插件对量化的 Llama 3.1 8b 模型进行推理时出现“从 __Int64 转换为无符号 int 的错误”,怎么解决?

    安装了 OpenVINO™ GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    发表于 06-25 07:20

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    开源新一代通义千问模型Qwen3。据悉,Qwen3模型参数量仅为DeepSeek - R1的1/3
    的头像 发表于 04-30 16:08 1125次阅读

    今日看点丨台积电、Intel合资运营代工业务;韩国计划向当地汽车行业注入3万亿韩元援助

    1. Meta 发布人工智能新模型系列 Llama 4 ,首次采用“混合专家”架构   当地时间周六(4月5日),美国科技巨头Meta推出
    发表于 04-07 11:26 590次阅读

    低至¥2.27/h!就能使用全球最强开模型——千问 QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开模型——千问QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通义千问发布的最新开源
    的头像 发表于 03-19 12:34 875次阅读
    低至¥2.27/h!就能使用全球<b class='flag-5'>最强开</b>元<b class='flag-5'>模型</b>——千问 QwQ-32B

    无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?

    无法在 OVMS 上运行来自 Meta 的大型语言模型 (LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时
    发表于 03-05 08:07

    今年,还要抢GPU?

    最近一短时间以来,被国内一家AI大模型初创公司DeepSeek刷屏了。短短几个月内,DeepSeek推出的两款开源大语言模型——DeepSeek-V
    的头像 发表于 02-14 10:04 594次阅读
    今年,还要抢GPU?

    OpenAI即将推出GPT-5模型

    OpenAI首席执行官奥尔特曼近日宣布了一项重要消息:OpenAI将在今年未来几个月内推出全新的GPT-5模型。这一消息引起了业界的广泛关注和期待。 据了解,GPT-5
    的头像 发表于 02-13 11:21 912次阅读

    Meta组建四大专研小组,深入探索DeepSeek模型

    近日,据报道,脸书母公司Meta为了提升其大模型Llama的性能,专门成立了四个研究小组,深入探索量化巨头幻方量化旗下的国产大模型DeepSeek的工作原理。 据悉,
    的头像 发表于 02-05 14:02 704次阅读

    在算力魔方上本地部署Phi-4模型

    ​作者:算力魔方创始人/英特尔边缘计算创新大使 刘力 前面我们分享了《Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑》,Llam
    的头像 发表于 01-15 11:05 781次阅读
    在算力魔方上本地部署Phi-4<b class='flag-5'>模型</b>

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何加速系统上为 AI 智能体提供强效助力。
    的头像 发表于 01-09 11:11 1180次阅读

    Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

    ​在人工智能领域,Meta的最新动作再次引起了全球的关注。今天,我们见证了Meta发布的 Llama 3.3 70B 模型,这是一个开源的人
    的头像 发表于 12-18 16:46 877次阅读
    <b class='flag-5'>Meta</b>重磅发布<b class='flag-5'>Llama</b> 3.3 70B:<b class='flag-5'>开源</b>AI<b class='flag-5'>模型</b>的新里程碑

    Meta发布新AI模型Meta Motivo,旨在提升元宇宙体验

    Meta公司近日宣布,将推出一款名为Meta Motivo的全新人工智能模型。该模型具备控制类似人类的数字代理动作的能力,有望为元宇宙的用户
    的头像 发表于 12-16 10:34 1345次阅读

    Meta推出Metamate AI工具,进军企业市场

    基于Meta的大型语言模型Llama构建,集成了先进的自然语言处理技术和深度学习算法。它能够帮助员工进行编程、开展研究,以及起草内部和外部的沟通文稿,极大地提高了工作效率和质量。 据了解,Metamate以
    的头像 发表于 12-09 14:57 1343次阅读

    Meta推出Llama 3.3 70B,AI大模型竞争白热化

    在今年的AI领域,Meta也不甘落后,推出了其压轴之作——Llama 3.3 70B大模型。与此同时,马斯克的xAI也宣布其Grok模型从今
    的头像 发表于 12-09 14:50 1014次阅读