Meta推出最强开源模型Llama 3 要挑战GPT
Facebook母公司Meta Platforms(META.US)推出了开源AI大模型“Llama”的最新升级版本“Llama 3”,Meta公司这次开源了Llama 3 8B与70B两款不同规模的模型,开发者可以免费使用,而Meta公司还将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型。
据悉Meta用搭载超2.4万块H100芯片的计算机集群训练Llama 3。Llama 3最大参数规模超4000亿,训练token超15万亿,训练数据规模差不多是Llama 2的七倍。而且训练效率比Llama 2高3倍;同时在安全性也有非常明显的进步。对比GPT-3.5多种人类评估测评胜率超六成。
基于Llama 3模型目前已经覆盖Instagram、WhatsApp、Facebook等Meta公司的应用软件。
OpenAI的核心创始成员之一、特斯拉前AI总监Andrej Karpathy认为400B Llama3性能已接近GPT-4 的水平。
Meta首席产品官考克斯表示Llama 3在它参数模型的许多基准上都处于行业领先地位。
有业界分析师认为开源大模型Llama 3期待已久,Meta公司肯定非常希望Llama3能够超越OpenAI的GPT-4。
-
Meta
+关注
关注
0文章
316浏览量
12326 -
ChatGPT
+关注
关注
30文章
1596浏览量
10066 -
大模型
+关注
关注
2文章
3440浏览量
4960
发布评论请先 登录
【VisionFive 2单板计算机试用体验】3、开源大语言模型部署
使用 NPU 插件对量化的 Llama 3.1 8b 模型进行推理时出现“从 __Int64 转换为无符号 int 的错误”,怎么解决?
上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5
今日看点丨台积电、Intel合资运营代工业务;韩国计划向当地汽车行业注入3万亿韩元援助
低至¥2.27/h!就能使用全球最强开元模型——千问 QwQ-32B
无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?
OpenAI即将推出GPT-5模型
Meta组建四大专研小组,深入探索DeepSeek模型
NVIDIA推出开放式Llama Nemotron系列模型
Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

Meta推出最强开源模型Llama 3 要挑战GPT
评论