0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能预处理建构模块加速大数据机器学习算法案例解读

NJ90_gh_bee81f8 2017-12-06 16:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

IBM苏黎世实验室(IBM Zurich)的研究人员开发出通用的人工智能(AI)预处理建构模块,据称可较现有方法加速大数据(Big Data)机器学习算法至少10倍以上。

在日前于美国加州长滩举行的神经信息处理系统大会(NIPS 2017)上,IBM在发表这种新途径时解释,它采用了数学对偶性(duality),在Big Data串流中精心挑选能发挥效用的项目,并略过其余无效的选项。

IBM Zurich研究人员Celestine Dünner说:“我们的动机在于,当缺少足够的内存来为Big Data机器学习保存所有的数据时,如何使用硬件加速器,如绘图处理器(GPU)和现场可编程数组(FPGA)。”Celestine Dünner同时也是这一算法的共同发明人。

IBM Zurich数学家Thomas Parnell则表示:“我们应该算是最先提供了可加速10倍的通用解决方案。特别是针对传统的线性机器学习模型(目前广泛用于规模太大而无法用于神经网络进行训练的数据集),我们在最佳参考方案的基础上建置相关技术,并展示了至少10倍的加速方案。”

IBM苏黎世研究人员Thomas Parnell和Celestine Dünner讨论在NIPS 2017发表的预处理算法。

在一开始的展示中,研究人员使用Nvidia Quadro M4000 GPU搭配8GB内存,在容量约30GB的4万张照片数据集上进行训练——该照片数据集采用支持向量机器(SVM)的算法,先将影像解析为各种类别以进行辨识。SVM算法还可为所学习的模型建立几何式解读,这和无法证实其结论的神经网络是不一样的。IBM的数据预处理方法让该算法可在不到1分钟的时间完成执行,比目前采用有限内存训练的方法更快10倍。

该技术的关键在于对每个数据点进行预处理,查看它是不是已经处理数据点的数学对偶。如果是的话,那么算法就会自动略过,这个过程在数据集进行处理时变得越来越频繁出现。Dünner说:“我们在每个数据点以进行处理以前,我们先计算每个数据点的重要性,再以测量对偶差距大小的方式进行处理。”

Parnell说,“如果你的问题适于放在加速器的内存空间,那么在内存内部执行将会获得更好的结果。因此,我们的结果只适用于Big Data的问题。它不仅能让运行时间加快10倍以上,而且如果在云端执行时,也不必付出太多的成本。”

随着Big Data数据集越滚越大,这种节省时间和成本的预处理算法将会变得越来越重要。IBM指出,为了显示其基于对偶性的算法能够处理任意大小的数据集,该公司在NIPS上展示了8GPU的版本,它能处理网页广告的十亿次点击数据。

研究人员正进一步开发该算法,期望在不久部署于IBM BlueMix Cloud——称为基于对偶差距(duality-gap)的异质学习,适用于包括社群媒体、在线营销、目标式广告、查找电信数据模式以及欺诈检测等Big Data数据集。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1854

    浏览量

    76786
  • 人工智能
    +关注

    关注

    1813

    文章

    49746

    浏览量

    261600
  • SVM
    SVM
    +关注

    关注

    0

    文章

    154

    浏览量

    33588

原文标题:这是一个让基于GPU的AI训练加速10倍的神奇算法

文章出处:【微信号:gh_bee81f890fc1,微信公众号:面包板社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    数据预处理软核加速模块设计

    拼接操作,其预处理模块结构框图如下图 模块最后得到的信号为ddr_q、ddr_clk和ddr_wrreq。ddr_q是并行128bits图像数据,ddr_clk是RAM的出口时钟
    发表于 10-29 08:09

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文
    发表于 07-31 11:38

    FPGA在机器学习中的具体应用

    随着机器学习人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效
    的头像 发表于 07-16 15:34 2638次阅读

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    支持实时物体识别的视觉人工智能处理器RZ/V2MA数据手册

    。此外,利用了 DRP技术高灵活性特点的 OpenCV 加速器,除了可进行人工智能推理的图像预处理之外,还能在单芯片上实现人工智能范畴之外的高速图像
    的头像 发表于 03-18 18:12 743次阅读
    支持实时物体识别的视觉<b class='flag-5'>人工智能</b>微<b class='flag-5'>处理</b>器RZ/V2MA<b class='flag-5'>数据</b>手册

    人工智能机器学习以及Edge AI的概念与应用

    人工智能相关各种技术的概念介绍,以及先进的Edge AI(边缘人工智能)的最新发展与相关应用。 人工智能机器学习是现代科技的核心技术
    的头像 发表于 01-25 17:37 1582次阅读
    <b class='flag-5'>人工智能</b>和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>以及Edge AI的概念与应用

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    人工智能机器人技术和计算系统交叉领域感兴趣的读者来说不可或缺的书。这本书深入探讨了具身智能这一结合物理机器人和智能算法的领域,该领域正在
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】1.全书概览与第一章学习

    讲解如何构造具身智能基础模型的方法和步骤,包括数据采集、预处理、模型训练和评估等。 在第四部分,介绍了具身智能机器人的计算挑战,包括计算
    发表于 12-27 14:50

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效
    发表于 12-24 00:33

    人工智能推理及神经处理的未来

    人工智能行业所围绕的是一个受技术进步、社会需求和监管政策影响的动态环境。机器学习、自然语言处理和计算机视觉方面的技术进步,加速
    的头像 发表于 12-23 11:18 871次阅读
    <b class='flag-5'>人工智能</b>推理及神经<b class='flag-5'>处理</b>的未来

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    搜索策略等规划算法,强调了轨迹规划需要考虑机器人的运动学约束。在轨迹规划中,机器人需要同时考虑最大曲率、加速度限制等物理约束,生成平滑可行的运动轨迹。强化
    发表于 12-19 22:26

    Banana Pi 携手 ArmSoM 推出人工智能加速 RK3576 CM5 计算模块

    机器学习人工智能 (ML 和 AI) 工作负载,以及 Arm Mali G52-MC3 图形处理器和支持 H.264/H.265/MJPEG 编码和 H.265/H.265/VP9
    发表于 12-11 18:38