0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta Llama 3.1模型现已在亚马逊云科技正式可用

全球TMT 来源:全球TMT 作者:全球TMT 2024-07-25 09:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为生成式AI应用构建提供更多选择

北京2024年7月24日/美通社/ --亚马逊云科技宣布,Meta刚刚发布的新一代Llama模型现已在Amazon Bedrock和Amazon SageMaker中提供。客户也可以在基于Amazon Trainium和Amazon Inferentia自研芯片的Amazon Elastic Cloud Compute(Amazon EC2)实例中部署这些模型。Llama 3.1模型是一系列预训练和指令微调的大语言模型(LLMs),支持8B、70B和405B三种尺寸,适用于广泛的使用场景。开发人员、研究人员和企业可以用此模型进行文本摘要和分类、情感分析、语言翻译和代码生成。

Meta表示,Llama 3.1 405B是目前最优秀和最大的开源基础模型(foundation models, FMs)之一,为生成式AI能力设立了新标准。它特别适用于合成数据生成和模型蒸馏,这能在后续训练中提升较小尺寸Llama模型的性能。Llama 3.1 405B还在通用知识、数学、工具使用和多语言翻译方面有出色的表现。

得益于大幅增加的训练数据和规模,所有新的Llama 3.1模型相比之前的版本都有明显改进。这些模型支持128K的上下文长度,相较于Llama 3增加了12万个标记(Token),模型容量是上一版本的16倍,并提升了在以下八种语言对话场景中的推理能力,即英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。

Llama 3.1模型还增强对语言细微差别的理解能力,即能更好地理解上下文,并能更有效地处理复杂问题。该模型还可以从长篇文本中获取更多信息,以做出更明智的决策,并利用更丰富的上下文数据生成更加细致和凝练的回应。

亚马逊云科技首席执行官Matt Garman表示:"我们与Meta保持着长期合作关系,今天很高兴能将他们最先进的模型提供给我们的客户。客户普遍希望根据他们的具体用例自定义和优化Llama模型,通过在亚马逊云科技上访问Llama 3.1,客户可以利用最新的领先模型来负责任地构建AI应用。"

过去十年间,Meta一直致力于为开发人员提供工具,并促进开发人员、研究人员和企业之间的合作共赢。Llama模型提供各种参数尺寸,允许开发人员选择最适合其需求和推理预算的模型。亚马逊云科技上的Llama模型打开了充满无限可能的新世界,开发人员无需再担心扩展性或基础设施管理等问题。亚马逊云科技提供了一种简单的开箱即用的方式来使用Llama。

Meta创始人兼首席执行官马克•扎克伯格表示:"开源是让AI造福所有人的关键。我们一直在与亚马逊云科技合作,将整个Llama 3.1模型集成到Amazon SageMaker JumpStart和Amazon Bedrock中,这样开发人员就可以全面使用亚马逊云科技的各种能力来构建出色的应用,例如用于处理复杂任务的高级智能体。"

Llama 3.1模型的优势

Llama 3.1405B

适用于构建企业应用程序和研发

用例包括:长篇文本生成、多语言和机器翻译、编码工具使用、增强的上下文理解,以及高级推理和决策

Llama 3.170B

适用于内容创建、对话AI、语言理解和研发

用例包括:文本摘要、文本分类、情感分析和细微推理、语言建模、代码生成和遵循指令

Llama 3.18B

适用于计算能力和资源有限的情况以及移动设备

更快的训练时间

用例包括:文本摘要和分类、情感分析和语言翻译

亚马逊云科技提供对多种大语言模型的轻松访问

Amazon Bedrock为数万名客户提供安全、便捷的模型访问,提供性能卓越、完全托管的大型语言模型和其他基础模型选择,并具有领先的易用性,是客户开始使用Llama 3.1的便捷途径,其中8B和70B参数模型已经正式可用,405B版本现提供预览。

客户希望访问Llama 3.1模型并利用亚马逊云科技的所有安全性和功能,这些通过Amazon Bedrock提供的一个简单的API即可轻松实现,同时无需管理任何底层基础设施。客户还可以使用Llama 3.1提供的负责任AI能力,该功能能够与Amazon Bedrock的数据治理和评估功能配合使用,例如Guardrails和模型评估。客户还可以使用Amazon Bedrock即将推出的微调功能来自定义模型。

Amazon SageMaker是数据科学家和机器学习工程师预训练、评估和微调基础模型的绝佳平台,能够提供先进的技术和精细的控制能力来部署基础模型,以满足生成式AI用例在准确性、延迟和成本方面的严格要求。今天,通过Amazon SageMaker JumpStart,客户仅需几次点击即可发现和部署所有Llama 3.1模型。随着即将推出的微调功能,数据科学家和机器学习工程师将能够更进一步使用Llama 3.1,例如在短短几小时内将Llama 3.1适配于他们的特定数据集。

亚马逊云科技首席执行官Matt Garman表示:"Amazon Bedrock是使用Llama 3.1进行快速构建的简单途径,提供行业领先的隐私和数据治理评估功能和内置保护措施。Amazon SageMaker提供的工具选择和精细控制,则使各行各业的客户能够轻松训练和调整Llama模型,以推动亚马逊云科技上的生成式AI创新。"

对于希望通过自管理机器学习工作流的方式在亚马逊云科技上部署Llama 3.1模型的客户,Amazon EC2提供广泛的加速计算选项,以为其提供更大的灵活性和对底层资源的控制。Amazon Trainium 和Amazon Inferentia2能够为微调和部署Llama 3.1模型提供高性能和成本效益。客户可以通过使用Amazon EC2 Trn1和Inf2实例在亚马逊云科技自研AI芯片上开启使用Llama 3.1的旅程。

客户已经在亚马逊云科技上使用Llama模型

全球金融服务集团野村控股(Nomura)的业务覆盖30个国家和地区。该集团正在使用Amazon Bedrock中的Llama模型简化海量行业文档的分析,以提取相关的商业信息,使员工可以将更多时间专注于从日志文件、市场评论或原始文档等数据源中提取洞见和获取关键信息。

领先的外包数字服务和客户体验提供商TaskUs使用Amazon Bedrock中的Llama模型来支持其专属生成式AI平台——TaskGPT。TaskUs在该平台上构建智能工具,自动化部分客户服务流程,释放团队成员处理更复杂的问题,并提供更好的客户体验。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Meta
    +关注

    关注

    0

    文章

    326

    浏览量

    12519
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137424
  • 亚马逊
    +关注

    关注

    8

    文章

    2745

    浏览量

    85939
  • 亚马逊云科技

    关注

    0

    文章

    115

    浏览量

    493
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    进迭时空 Upstream|全球主流大模型开源项目 llama.cpp

    作为全球最火的本地大模型推理引擎llama.cpp,进迭时空(SpacemiT)基于K3芯片的AI扩展指令集(IME2)成功合入全球主流开源项目llama.cpp主线,为端侧大模型推理
    的头像 发表于 05-18 18:04 5276次阅读
    进迭时空 Upstream|全球主流大<b class='flag-5'>模型</b>开源项目 <b class='flag-5'>llama</b>.cpp

    亚马逊技正式推出Amazon Security Agent按需渗透测试功能

    北京2026年4月8日 /美通社/ -- 亚马逊科技现已正式推出Amazon Security Agent按需渗透测试功能,使用户能够对所有应用程序运行全面的安全测试,而非仅针对最关键的应用。这一
    的头像 发表于 04-08 13:56 210次阅读

    亚马逊科技Amazon DevOps Agent智能运维助手正式可用

    北京2026年4月7日 /美通社/ -- 亚马逊科技宣布Amazon DevOps Agent现已正式可用。Amazon DevOps Agent是用户全天候随时待命的智能运维助手。
    的头像 发表于 04-07 14:59 212次阅读

    NVIDIA与亚马逊科技深化合作伙伴关系

    NVIDIA 和亚马逊科技 (AWS) 扩展双方合作,增强在 AWS 平台上的由 NVIDIA 驱动的数据处理能力,并增加对 NVIDIA Nemotron 开放模型系列的支持。
    的头像 发表于 03-23 15:17 570次阅读

    Meta的AI慢性病,靠Manus能治吗?

    Meta
    脑极体
    发布于 :2026年01月08日 16:58:02

    亚马逊科技扩展模型选择 Amazon Bedrock新增18款开放权重模型

    亚马逊科技在2025 re:Invent全球大会上宣布在Amazon Bedrock中新增18款开放权重模型,进一步强化其提供广泛全托管模型选择的承诺。Amazon Bedrock使
    的头像 发表于 12-13 13:53 959次阅读

    商汤科技正式发布并开源全新多模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO,为日日新SenseNova 多模态模型奠定了新一代架构的基石。
    的头像 发表于 12-08 11:19 1245次阅读
    商汤科<b class='flag-5'>技正</b>式发布并开源全新多模态<b class='flag-5'>模型</b>架构NEO

    亚马逊科技上线Amazon Nova多模态嵌入模型

    Embeddings多模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖多模态嵌入模型。该模型是首个通过单一
    的头像 发表于 10-29 17:15 440次阅读
    <b class='flag-5'>亚马逊</b><b class='flag-5'>云</b>科技上线Amazon Nova多模态嵌入<b class='flag-5'>模型</b>

    亚马逊科技Amazon Bedrock AgentCore正式可用,引领Agent走向全面落地

    Amazon Bedrock AgentCore打破原型困境,助力Agent安全、可扩展、高可靠地投入生产   北京——2025年10月14日  亚马逊科技宣布, Amazon Bedrock
    的头像 发表于 10-14 17:06 1018次阅读
    <b class='flag-5'>亚马逊</b><b class='flag-5'>云</b>科技Amazon Bedrock AgentCore正式<b class='flag-5'>可用</b>,引领Agent走向全面落地

    亚马逊科技宣布推出Qwen3与DeepSeek-V3.1模型的完全托管服务

    亚马逊科技致力于成为运行开放权重模型的最佳平台,在Amazon Bedrock上新增五个模型选项,持续丰富模型选择,进一步满足客户需求。
    的头像 发表于 09-19 10:11 1136次阅读

    亚马逊科技Amazon Bedrock模型再更新,Anthropic最新版Claude4模型现已上线

    北京2025年8月6日 /美通社/ -- 亚马逊科技宣布,Anthropic最新一代模型Claude Opus 4.1与Claude Sonnet 4,现已在Amazon Bedro
    的头像 发表于 08-06 19:42 844次阅读
    <b class='flag-5'>亚马逊</b><b class='flag-5'>云</b>科技Amazon Bedrock<b class='flag-5'>模型</b>再更新,Anthropic最新版Claude4<b class='flag-5'>模型</b><b class='flag-5'>现已</b>上线

    亚马逊科技现已上线OpenAI开放权重模型

    客户现可通过Amazon Bedrock和Amazon SageMaker AI使用OpenAI开放权重模型,实现将先进的开放权重模型与全球最广泛服务的深度集成。 亚马逊
    的头像 发表于 08-06 19:29 1027次阅读

    Oracle Database@Amazon Web Services现已正式可用

    即日起,客户可以在亚马逊科技北弗吉尼亚区域和俄勒冈区域使用Oracle Database@Amazon Web Services,后续将扩展至全球其他20个区域。 富达投资集团、全美互惠保险公司
    的头像 发表于 07-21 15:11 994次阅读

    超低延时重构AI推理体验!白山发布“大模型API”产品

    白山技正式发布“大模型API”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大语言模型。基于白山全
    的头像 发表于 07-02 17:26 1331次阅读
    超低延时重构AI推理体验!白山<b class='flag-5'>云</b>发布“大<b class='flag-5'>模型</b>API”产品

    使用 NPU 插件对量化的 Llama 3.1 8b 模型进行推理时出现“从 __Int64 转换为无符号 int 的错误”,怎么解决?

    安装了 OpenVINO™ GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    发表于 06-25 07:20