0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AWS的部分优秀机器学习工具整理

倩倩 来源:segmentfault 2020-07-17 10:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着技术和生态的不断演进、应用场景的不断探索,机器学习已然不再仅仅停留在实验室当中。无论是日新月异的互联网应用,还是求新求变的企业转型,机器学习都得到了广泛的应用,逐步成为驱动业务的关键技术。

机器学习在近 30 多年已发展为一门多领域交叉学科,也已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA 序列测序、语音和手写识别、战略游戏和机器人等领域。

为了帮助大家更便捷的解决这些实际问题,让数据科学家、算法工程师、业务开发者都能轻松驾驭机器学习,AWS 推出了各式各样的机器学习工具,包括:ML 服务类、API 类、AI 服务工具类等。

今天,我们就对 AWS 的部分优秀机器学习工具做一个整理,分享给各位行业从业者。

一。 ML 服务类机器学习工具

1. Amazon SageMaker

Amazon SageMaker 是一项完全托管的服务,可为每位开发人员和数据科学家提供快速构建、训练和部署机器学习 (ML) 模型的能力。

开发者可以在一个集成的可视界面中编写代码、跟踪实验、可视化数据以及进行调试和监控。从完整的平台 IDE,到具体代码与 API,SageMaker 都有一种 Pythonic 精神,简洁易用,同时提供高级的接口。消除了机器学习过程中的每个步骤的繁重工作,让开发者能够更轻松地开发高质量模型,提高开发人员的工作效率。

2020 年 4 月底,SageMaker 在 AWS 中国的北京区域和宁夏区域上正式开放。就在前不久,在国内开始正式开放。这标志着 AWS 人工智能、机器学习平台服务的关键技术已全面进入中国。

工具亮点:

这是第一个用于机器学习的完全集成式开发环境 (IDE)

单一集成的可视界面操作,大幅提高开发效率

可自动构建、训练和调试完全可视和可控的模型

使用 Amazon SageMaker Ground Truth 将数据标记成本降低多达 70%

使用 Amazon Elastic Inference 可将机器学习推理成本降低多达 75% API 类

二。 API 类机器学习工具

1. 文本转语音:Amazon Polly

Amazon Polly 是一项云服务,可以将文本转化为逼真的语音。支持多种语言,并包含各种逼真的声音,因此你可以构建在多个位置工作的支持语音的应用程序,并为你的客户使用理想的语音。

此外,Amazon Polly 还包含许多神经文本到语音转换 (NTTS) 语音,通过新的机器学习方法为语音质量带来突破性的改进,从而为客户提供尽可能最自然的文本到语音的似人类的语音。神经 TTS 技术还支持播音员风格,专为新闻播报使用案例量身定制。

Amazon Polly 的常用案例包括移动应用程序(如新闻阅读器、游戏、电子学习平台)、视障人士辅助功能应用程序以及快速增长的物联网IoT) 细分市场。Alexa 语音助手的品牌定制语音服务,就是通过 Amazon Polly 语音合成平台提供的。

工具亮点:

高质量:新的神经 TTS 和一流的标准 TTS 技术,可合成发音精度极高的超自然语音;

支持多种语言和语音:支持数十种语音语言,并为大多数语言提供男性和女性语音选项。

经济实惠:Amazon Polly 采用按需付费定价模式,每字符转换成本低廉,并且支持无限次重放,使企业能够以经济高效的方式为应用程序添加语音功能。

2.语音转文本:Amazon Transcribe

Amazon Transcribe 是一项自动语音识别 (ASR) 服务,让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,可以分析 Amazon S3 中存储的音频文件,并让该服务返回一个转录的语音文本文件。开发人员还可以将实时音频流发送到 Amazon Transcribe,并实时接收转录流。

Amazon Transcribe 可用于很多常见应用程序,包括客户服务通话转录,以及基于音频和视频内容生成字幕。该服务可以转录以常见格式(例如 WAV 和 MP3)存储的音频文件,并为每个词附加时间戳,以便开发者可以通过搜索文本轻松找到原始源中的音频。

工具亮点:

便于阅读的转录:Amazon Transcribe 采用深度学习功能自动添加标点符号和格式,从而使输出内容更容易理解,无需进一步编辑即可直接使用。

生成时间戳:Amazon Transcribe 会为每个词返回时间戳,以便可以通过搜索文本轻松找到原始录音中的音频。

自定义词汇表:Amazon Transcribe 支持扩展和自定义语音识别词汇表。使用者可以将新词添加到基本词汇表中,并生成使用案例特定的高度准确的转录,例如产品名称、域特定术语或个人姓名。

识别多个讲话者:Amazon Transcribe 能够识别出讲话者的变化,并相应地确定转录文本的归属。这样可以显著减少转录具有多个讲话者的音频(例如电话、会议和电视节目)所需的工作量。

3.从文档中提取文本和数据:Amazon Textract

Amazon Textract 是一项从扫描的文档中自动提取文本和数据的服务。Amazon Textract 的功能不只是简单的光学字符识别 (OCR),它还可以识别表单中字段的内容和表格中存储的信息。

借助 Textract,开发人员可以快速自动执行文档工作流,数小时可处理数百万个文档页面。此外,开发人员还可以创建智能搜索索引,构建自动批准工作流,并通过标记可能需要校订的数据,更好地保持对文档存档规则的符合性。

结合 Amazon Augmented AI (Amazon A2I) 后,开发人员可以通过内置人工审核来管理需要人工判断的细微或敏感工作流,从而取得高确信度的预测或对预测进行持续审计。

工具亮点:

快速准确地提取数据:Amazon Textract 可以自动检测文档的布局和页面上的关键元素,了解任何嵌入式表单或表格中的数据关系,并提取附带完整上下文的所有内容。

无需维护代码或模板:借助 Amazon Textract 预先经过训练的机器学习模型,无需为数据提取编写代码,不需要为可能收到的每个文档或表单维护代码,也不必担心页面布局随着时间的推移而发生变化。

更低的文档处理成本:Amazon Textract 以非常低的成本提供 OCR 和结构化数据提取(表单和表格),你只需按照实际使用量付费,无需预先承诺或长期合同。

三。 AI 服务类机器学习工具

1. 代码审查工具 —— Amazon CodeGuru

Amazon CodeGuru 是一种机器学习服务,可自动执行代码审查,并提供应用程序性能建议。它可以帮助开发人员找到影响应用程序性能的代码行,并版主进行问题排查,然后提供修复或改进代码的具体建议。

CodeGuru 由机器学习、最佳实践以及经在开源项目和 Amazon 内部分析数百万项代码审查和数千个应用程序后总结出来的经验教训提供支持。

2. 快速构建深度学习应用程序 —— AWS Deep Learning AMI

AWS Deep Learning AMI (DLAMI) 是在云中进行深度学习的一站式商店,可以为机器学习从业人员和研究人员提供基础设施和各种工具,从而加快在云中进行任意规模的深度学习的速度。

通过 DLAMI,开发人员可以快速启动预先安装了常见深度学习框架和界面(如 TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras)的 Amazon EC2 实例来训练复杂的自定义 AI 模型、试验新算法或学习新技能和技巧。

无论需要 Amazon EC2 GPU 还是 CPU 实例,都无需为 Deep Learning AMI 支付额外费用。只需为存储和运行应用程序所需的 AWS 资源付费。

AWS Deep Learning AMI 可在专为推理设计的基于 Intel 的 Amazon EC2 C5 实例上运行。AMI 预安装了 NVIDIA CUDA 和 cuDNN 驱动程序,可以有效缩短完成计算所需的时间。

为了简化软件包的管理和部署,AWS Deep Learning AMI 安装了 Anaconda2 和 Anaconda3 数据科学平台,可以进行大规模数据处理、预测分析和科学计算。

工欲善其事必先利其器,想要进行机器学习方面的工作研究,配合上优秀的工具一定可以事半功倍。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47452
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233
  • 自然语言处理

    关注

    1

    文章

    629

    浏览量

    14563
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI 驱动三维逆向:点云降噪算法工具机器学习建模能力的前沿应用

    在三维逆向工程领域,传统方法在处理复杂数据和构建高精度模型时面临诸多挑战。随着人工智能(AI)技术的发展,点云降噪算法工具机器学习建模能力的应用,为三维逆向工程带来了创新性解决方案,显著提升
    的头像 发表于 08-20 10:00 449次阅读
    AI 驱动三维逆向:点云降噪算法<b class='flag-5'>工具</b>与<b class='flag-5'>机器</b><b class='flag-5'>学习</b>建模能力的前沿应用

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 2632次阅读

    告别摸索!TSMaster官方最全学习路径整理

    与测试。但对于初学者来说,面对TSMaster丰富的功能模块,往往不知从何入手。本文将为您梳理一条清晰的TSMaster学习路线,帮助您系统掌握这一工具。1认识TSM
    的头像 发表于 06-13 20:06 762次阅读
    告别摸索!TSMaster官方最全<b class='flag-5'>学习</b>路径<b class='flag-5'>整理</b>

    作为硬件工程师,你用那款PCB 设计软件?超全EDA工具整理

    还在为选PCB设计软件头秃?这篇“闭坑指南”必须码住!吐血整理全网EDA工具——
    的头像 发表于 05-23 12:07 3170次阅读
    作为硬件工程师,你用那款PCB 设计软件?超全EDA<b class='flag-5'>工具</b><b class='flag-5'>整理</b>!

    NXP eIQ Time Series Studio 工具使用攻略(九)-数据标签

    其中"Data Labeling",数据标签工具使用户能够通过可视化界面将相应的数据标签(如电弧或无电弧)应用于当前数据图形的不同部分,从而对导入的原始数据进行分类。然后,该工具根据标签对原始数据进行细分,并创建用于训练
    的头像 发表于 05-22 09:51 1367次阅读
    NXP eIQ Time Series Studio <b class='flag-5'>工具</b>使用攻略(九)-数据标签

    **【技术干货】Nordic nRF54系列芯片:传感器数据采集与AI机器学习的完美结合**

    【技术干货】nRF54系列芯片:传感器数据采集与AI机器学习的完美结合 近期收到不少伙伴咨询nRF54系列芯片的应用与技术细节,今天我们整理几个核心问题与解答,带你快速掌握如何在nRF54上部署AI
    发表于 04-01 00:00

    电话配线架怎么整理好看

    断开与电话配线架相关的电源和通信连接,以避免在整理过程中发生意外。 准备工具: 准备必要的工具,如剥线刀、打线刀、扎带、IDC配线架模块等,以便在整理过程中使用。 二、
    的头像 发表于 02-19 11:34 927次阅读

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 619次阅读

    嵌入式机器学习的应用特性与软件开发环境

    作者:DigiKey Editor 在许多嵌入式系统中,必须采用嵌入式机器学习(Embedded Machine Learning)技术,这是指将机器学习模型部署在资源受限的设备(如微
    的头像 发表于 01-25 17:05 1210次阅读
    嵌入式<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用特性与软件开发环境

    传统机器学习方法和应用指导

    用于开发生物学数据的机器学习方法。尽管深度学习(一般指神经网络算法)是一个强大的工具,目前也非常流行,但它的应用领域仍然有限。与深度学习相比
    的头像 发表于 12-30 09:16 1982次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 699次阅读

    【「具身智能机器人系统」阅读体验】+初品的体验

    《具身智能机器人系统》 一书由甘一鸣、俞波、万梓燊、刘少山老师共同编写,其封面如图1所示。 本书共由5部分组成,其结构和内容如图2所示。 该书可作为高校和科研机构的教材,为学生和研究人员提供系统
    发表于 12-20 19:17

    zeta在机器学习中的应用 zeta的优缺点分析

    在探讨ZETA在机器学习中的应用以及ZETA的优缺点时,需要明确的是,ZETA一词在不同领域可能有不同的含义和应用。以下是根据不同领域的ZETA进行的分析: 一、ZETA在机器学习
    的头像 发表于 12-20 09:11 1626次阅读

    Arm与AWS合作深化,AWS Graviton4展现显著进展

    Arm与亚马逊云科技(AWS)的长期合作关系,一直致力于为云计算领域带来性能更强劲、更高效和可持续的解决方案。双方通过专用芯片和计算技术的结合,不断推动云计算的发展。 在近期举行的AWS re
    的头像 发表于 12-18 14:17 847次阅读

    【面试题】人工智能工程师高频面试题汇总:机器学习深化篇(题目+答案)

    ,或者深度学习的框架,还有怎么优化模型,这些都是加分项,能有效提高面试通过率。本篇小编整理了一些高频的机器学习深化方面的面试题,这些题目都是从实际面试中总结出来的,非
    的头像 发表于 12-16 13:42 3310次阅读
    【面试题】人工智能工程师高频面试题汇总:<b class='flag-5'>机器</b><b class='flag-5'>学习</b>深化篇(题目+答案)