人工智能预处理建构模块加速大数据机器学习算法案例解读-电子发烧友网

IBM苏黎世实验室(IBM Zurich)的研究人员开发出通用的人工智能(AI)预处理建构模块，据称可较现有方法加速大数据(Big Data)机器学习算法至少10倍以上。

在日前于美国加州长滩举行的神经信息处理系统大会(NIPS 2017)上，IBM在发表这种新途径时解释，它采用了数学对偶性(duality)，在Big Data串流中精心挑选能发挥效用的项目，并略过其余无效的选项。

IBM Zurich研究人员Celestine Dünner说：“我们的动机在于，当缺少足够的内存来为Big Data机器学习保存所有的数据时，如何使用硬件加速器，如绘图处理器(GPU)和现场可编程数组(FPGA)。”Celestine Dünner同时也是这一算法的共同发明人。

IBM Zurich数学家Thomas Parnell则表示：“我们应该算是最先提供了可加速10倍的通用解决方案。特别是针对传统的线性机器学习模型(目前广泛用于规模太大而无法用于神经网络进行训练的数据集)，我们在最佳参考方案的基础上建置相关技术，并展示了至少10倍的加速方案。”

IBM苏黎世研究人员Thomas Parnell和Celestine Dünner讨论在NIPS 2017发表的预处理算法。

在一开始的展示中，研究人员使用Nvidia Quadro M4000 GPU搭配8GB内存，在容量约30GB的4万张照片数据集上进行训练——该照片数据集采用支持向量机器(SVM)的算法，先将影像解析为各种类别以进行辨识。SVM算法还可为所学习的模型建立几何式解读，这和无法证实其结论的神经网络是不一样的。IBM的数据预处理方法让该算法可在不到1分钟的时间完成执行，比目前采用有限内存训练的方法更快10倍。

该技术的关键在于对每个数据点进行预处理，查看它是不是已经处理数据点的数学对偶。如果是的话，那么算法就会自动略过，这个过程在数据集进行处理时变得越来越频繁出现。Dünner说：“我们在每个数据点以进行处理以前，我们先计算每个数据点的重要性，再以测量对偶差距大小的方式进行处理。”

Parnell说，“如果你的问题适于放在加速器的内存空间，那么在内存内部执行将会获得更好的结果。因此，我们的结果只适用于Big Data的问题。它不仅能让运行时间加快10倍以上，而且如果在云端执行时，也不必付出太多的成本。”

随着Big Data数据集越滚越大，这种节省时间和成本的预处理算法将会变得越来越重要。IBM指出，为了显示其基于对偶性的算法能够处理任意大小的数据集，该公司在NIPS上展示了8GPU的版本，它能处理网页广告的十亿次点击数据。

研究人员正进一步开发该算法，期望在不久部署于IBM BlueMix Cloud——称为基于对偶差距(duality-gap)的异质学习，适用于包括社群媒体、在线营销、目标式广告、查找电信数据模式以及欺诈检测等Big Data数据集。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

IBM

IBM

+关注

关注
3

文章
1673

浏览量
74273
人工智能

人工智能

+关注

关注
1776

文章
43871

浏览量
230627
SVM

SVM

+关注

关注
0

文章
154

浏览量
32187

原文标题：这是一个让基于GPU的AI训练加速10倍的神奇算法

文章出处：【微信号：gh_bee81f890fc1，微信公众号：面包板社区】欢迎添加关注！文章转载请注明出处。

ai人工智能机器人

随着时间的推移，人工智能的发展越来越成熟，智能时代也离人们越来越近，近几年人工智能越来越火爆，人工智能的应用已经开始渗透到各行各业，与生活交融，成为人们无法拒绝，无法失去的一个重要存在

发表于 09-21 11:09

不可错过！人工神经网络算法、PID算法、Python人工智能学习等资料包分享（附源代码）

3.Python人工智能学习工具包+入门与实践资料集锦本资料的主要内容详细介绍的是Python工具包合集包括了：网页爬虫工具集，文本处理工具集，Python科学计算工具包，Python机器

发表于 09-13 16:41

如何将人工智能应用到效能评估系统软件中去解决

以使用机器学习算法，对实时数据进行分析和处理，以便更好地总结和预测未来趋势。　　其次，华盛恒辉人工智能

发表于 08-30 12:58

人工智能和机器学习的区别有哪些

人工智能和机器学习通常可以互换着使用，但是人工智能更加宽泛，人工智能由更多的技术所组成，机器

发表于 08-25 08:23 •1378次阅读

机器学习为什么需要数据预处理

数据预处理是准备原始数据并使其适合机器学习模型的过程。这是创建机器

发表于 08-24 09:20 •1156次阅读

传感器、大数据、机器学习、人工智能和机器人如何彼此影响？

传感器、大数据、机器学习、人工智能和机器人是怎样拧在一起了呢？在人工智能时代硬件和软件是共生演化

发表于 08-17 09:56 •694次阅读

人工智能大数据是什么

首先，我们需要了解人工智能大数据的定义。通俗地说，人工智能大数据就是将人工智能技术和大数据技术相

发表于 08-13 10:57 •2192次阅读

什么是人工智能与大数据

人工智能与大数据在不同领域中都扮演着至关重要的角色。在技术领域，人工智能和大数据可用于智能交互和自动化流程、

发表于 08-13 09:41 •1561次阅读

人工智能大数据如何解决

人工智能和大数据旨在通过处理和分析海量的数据来获得有价值的信息。然而，在数据分析的过程中发现，某些数据

发表于 08-13 09:26 •709次阅读

大数据属于人工智能吗

从不同的方面来考虑。首先，要理解大数据和人工智能之间的区别。大数据是一种技术工具，它可以处理大量的数据，提供准确的分析和预测，但它并不具备

发表于 08-12 17:44 •2039次阅读

大数据是人工智能吗

和人工智能到底有什么关系？大数据是不是人工智能的代名词？下面将从多个角度来探讨这个问题。一、大数据是什么？ 大数据是指规模超过传统

发表于 08-12 17:12 •990次阅读

怎么学习人工智能

怎么学习人工智能 人工智能是当今最热门的领域之一，因其在工业、商业、医疗和其他行业中的应用而广受欢迎。学习人工智能可以带来许多好处，例如深入

发表于 08-12 16:43 •735次阅读

人工智能的算法有哪些？

等。本文将对这些算法进行一一介绍。（以下算法仅供读者了解和参考，并非技术指导） · 机器学习算法机器

发表于 08-09 17:49 •1874次阅读

人工智能与大数据的关系和影响

人工智能和大数据是密不可分的。大数据提供了足够的数据让机器学习，从而使

发表于 08-03 17:45 •1419次阅读

人工智能、算法与机器学习辨析

人工智能 (AI)、机器学习 (ML) 和算法这几个词经常出现误用、混淆和误解。尽管它们都有各自的固定含义，但是人们常常会将这几个概念互换使用。遗憾的是，如果没有领会这些含义，它们可能

发表于 05-09 10:55 •1522次阅读