0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta推出最强开源模型Llama 3 要挑战GPT

A面面观 2024-04-19 17:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Meta推出最强开源模型Llama 3 要挑战GPT

Facebook母公司Meta Platforms(META.US)推出了开源AI大模型“Llama”的最新升级版本“Llama 3”,Meta公司这次开源了Llama 3 8B与70B两款不同规模的模型,开发者可以免费使用,而Meta公司还将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型。

据悉Meta用搭载超2.4万块H100芯片的计算机集群训练Llama 3。Llama 3最大参数规模超4000亿,训练token超15万亿,训练数据规模差不多是Llama 2的七倍。而且训练效率比Llama 2高3倍;同时在安全性也有非常明显的进步。对比GPT-3.5多种人类评估测评胜率超六成。

基于Llama 3模型目前已经覆盖Instagram、WhatsApp、Facebook等Meta公司的应用软件。

OpenAI的核心创始成员之一、特斯拉前AI总监Andrej Karpathy认为400B Llama3性能已接近GPT-4 的水平。

Meta首席产品官考克斯表示Llama 3在它参数模型的许多基准上都处于行业领先地位。

有业界分析师认为开源大模型Llama 3期待已久,Meta公司肯定非常希望Llama3能够超越OpenAI的GPT-4。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Meta
    +关注

    关注

    0

    文章

    325

    浏览量

    12496
  • ChatGPT
    +关注

    关注

    31

    文章

    1600

    浏览量

    10391
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技正式开源多模态自主推理模型SenseNova-MARS

    今日,商汤正式开源多模态自主推理模型 SenseNova-MARS(8B/32B 双版本),其在多模态搜索与推理的核心基准测试中以 69.74 分超越Gemini-3-Pro(69.06 分)、
    的头像 发表于 01-30 10:13 782次阅读
    商汤科技正式<b class='flag-5'>开源</b>多模态自主推理<b class='flag-5'>模型</b>SenseNova-MARS

    百度正式发布并开源新一代文档解析模型PaddleOCR-VL-1.5

    全球综合性能第一成绩,整体精度达到 94.5%,超过 Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2 等模型
    的头像 发表于 01-30 10:03 802次阅读
    百度正式发布并<b class='flag-5'>开源</b>新一代文档解析<b class='flag-5'>模型</b>PaddleOCR-VL-1.5

    上海交大发布国产光学大模型Optics GPT

    电子发烧友网综合报道 1月25日,上海交通大学正式推出光学领域垂直大语言模型——Optics GPT(光学大模型),这是一款完全自主研发的国产模型
    的头像 发表于 01-26 09:59 2202次阅读
    上海交大发布国产光学大<b class='flag-5'>模型</b>Optics <b class='flag-5'>GPT</b>

    谷歌正式推出Gemini 3 Flash模型

    我们正式推出了 Gemini 3 Flash,这是以较低成本打造的高效前沿智能,成功地进一步扩展了 Gemini 3 模型系列。
    的头像 发表于 01-22 16:04 725次阅读

    【CIE全国RISC-V创新应用大赛】基于 K1 AI CPU 的大模型部署落地

    的 落地方案 : 1. 系统部署方案书 (System Proposal) 方案要点 部署工具 :使用官方提供的 spacemit-llama.cpp (v0.0.4) 二进制包。 模型策略 :采用
    发表于 11-27 14:43

    新思科技SLM解决方案守护AI芯片万亿算力

    2024年,Meta训练了一款AI模型Llama 3”,并将相关训练成果汇总发表了一篇论文,受到广泛关注。在为期54天的预训练过程中,Llama
    的头像 发表于 11-21 14:03 763次阅读
    新思科技SLM解决方案守护AI芯片万亿算力

    GPT-5.1发布 OpenAI开始拼情商

    -5.1 Thinking:高级推理模型,在简单任务上更快,在复杂任务上更持久,也更容易理解。 对于新上线的GPT-5.1大模型,OpenAI 官方表示出色的 AI 不仅是够聪明,还
    的头像 发表于 11-13 15:49 812次阅读

    成都汇阳投资关于大模型白热化,应用加速分化

           大模型: 加速多模态研发 ,闭源模型逐步逆袭开源 多模态技术路线尚未收敛 , 国内外大模型厂商持续刷新 SOAT。 图片领域 ,GPT
    的头像 发表于 09-09 09:30 1079次阅读

    大规模专家并行模型在TensorRT-LLM的设计

    DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质量。
    的头像 发表于 09-06 15:21 1416次阅读
    大规模专家并行<b class='flag-5'>模型</b>在TensorRT-LLM的设计

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企
    的头像 发表于 08-14 11:34 1540次阅读

    讯飞星辰MaaS平台率先上线OpenAI最新开源模型

    8月6日凌晨,OpenAI 时隔六年再次回归开源,发布两款全新的大语言模型gpt-oss-120b和gpt-oss-20b,性能与o4-mini 水平相当,并且可以在消费级硬件上运行
    的头像 发表于 08-13 16:43 1891次阅读

    OpenAI发布2款开源模型

    OpenAI开源了两款高性能权重语言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt
    的头像 发表于 08-06 14:25 1143次阅读

    【VisionFive 2单板计算机试用体验】3开源大语言模型部署

    1、ollama平台搭建 ollama可以快速地部署开源模型,网址为https://ollama.com, 试用该平台,可以在多平台上部署 Deepseek-R1, Qwen3, Llama
    发表于 07-19 15:45

    使用 NPU 插件对量化的 Llama 3.1 8b 模型进行推理时出现“从 __Int64 转换为无符号 int 的错误”,怎么解决?

    安装了 OpenVINO™ GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    发表于 06-25 07:20

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    开源新一代通义千问模型Qwen3。据悉,Qwen3模型参数量仅为DeepSeek - R1的1/3
    的头像 发表于 04-30 16:08 1493次阅读