0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔BigDL深挖大数据价值 助力分布式人工智能广泛落地

话说科技 来源:话说科技 作者:话说科技 2022-02-22 13:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“没说就是零卡。”近日,网络健身博主@秃顶吴彦祖的金句意外走红,揭开了无数撸铁干饭王的最强自我欺骗套路——只要食物包装上没有注明卡路里,吃了它我就不会发胖!除此之外,“冰可乐没有热量”、“卡路里正正得负”等高频弹幕也常常令人忍俊不禁。实际上,它们并不仅仅是几句戏言,通过Transformer Cross Transformer (TxT)人工智能推荐系统,汉堡王发现,当人们把高热量食物而非低热量食物加入购物车时,他们更愿意再点一份甜点。也就是说,高热量食物和高热量食物更配哦!另外,TxT还发现,即使天气很冷,汉堡王的顾客都会点上一份奶昔——而此前人们一般认为,低温天气会使冷饮销量降低。

其实,想要在客户服务中使用人工智能,尤其是快餐推荐,线下快餐门店面临着自己独特的挑战。相比电子商务、搜索引擎等能够在较为充裕的时间内通过大量推理与训练,掌握用户偏好的行业,对于快餐品牌而言,目前仍然没有什么简单的方法可以在瞬间识别客户并检索到他们的档案,因为所有食物推荐都是在线下完成的。此外,在把位置、上下文特征加载到模型之前,还必须对此类数据进行预处理,对于要求快速响应的线下快餐门店来说,这着实是一个不小的难题。

为了应对这些挑战,汉堡王的Transformer Cross Transformer (TxT)人工智能推荐系统应运而生。该系统采用了所谓的“双”Transformer架构,既能够学习实时订单序列数据,也能够学习位置、天气和订单行为等特征。TxT可以利用餐馆中所有可用的数据点,而无需在接单流程开始之前识别顾客。例如,如果顾客在其购物车内加入的第一款商品是奶昔,那么这将影响TxT的推荐,这些推荐基于顾客过去购买的商品、当下购买的商品以及商店售卖的商品。这是从模型方面的创新。

另一方面的创新则是统一的大数据处理和模型训练的流水线。目前,大多数企业的做法是建立两个模型,一个模型做大数据处理,一个模型做深度学习,但这一方式效率低下,拷贝文件就占了整个训练20%以上的时间。而英特尔和汉堡王合作创建的端到端推荐流水线将整个端到端的数据处理和模型训练迁移到基于BigDL的统一的平台上,其中包括分布式Apache Spark数据处理和在英特尔至强集群上进行的Apache MXNet训练,能够让企业直接在现有集群上运行程序,从而大大提高了人工智能的工作效率。

说到这里,你会发现,想要将AI部署于现实的应用,其中所面临的一个重大挑战就是针对生产数据集进行数据分析、机器学习和深度学习。生产数据集来源于庞大的分布式数据仓库,而按照传统方法,企业需要设立两个单独的集群,一个用于大数据,导出数据并转移到另外一个深度学习集群进行建模,该集群运行TensorFlow、PyTorch等。在这种架构下,首先会产生大量与数据移动相关的开销,其次,它会产生隔离的工作流,从而大大降低开发效率。

而针对上述难题,英特尔BigDL 2.0有着清晰的解决思路——提供一个统一的大数据架构,为分布式AI提供统一的端到端管道。如此一来,企业就可以在同一个集群、同一个应用内使用Spark等处理数据仓库中的数据。在此基础上,人们可以针对内存Spark Dataframes直接使用TensorFlow、PyTorch、OpenVINO等深度学习AI模型。Spark Dataframes是驻留在内存中的数据集,分布在整个集群上,客户可以透明地在分布式数据集上使用这些AI模型、AI算法——都在一个集群内,更重要的是,一个程序,只需一个工作流。

通过这种方法,英特尔的一些客户,如中国最大的软硬件厂商之一的浪潮,已经成功将研发周期从几个季度缩短到几个月。毋庸置疑,这一显著的进步极大推动了人工智能现实应用的进一步发展。

而在这一成就的背后,是英特尔BigDL 2.0所凝结的大量创新。分布式模式运行本地笔记本上的代码。实际上,这一直是很多数据科学家的痛点,他们没法简单地获取一个单节点PythonNotebook,并在集群上以分布式模式运行,因此,他们通常需要重写代码。

在Orca中,英特尔BigDL尝试让用户可以把笔记本电脑上运行的Notebook部署到分布式集群,云中托管的Kubernetes集群、或者Hadoop集群。在Notebook的一开始,只需调用Orca下文中的一个方法,它会告诉程序用户希望运行哪个环境,可以是在本地笔记本电脑上,也可以是本地集群或者Kubernetes集群等。只需改变一行代码,这个Notebook就可以在本地笔记本电脑上运行,模拟分布式集群规模,在分布式环境中处理大型数据集。

而在更高层级的运用,即基于这些管道开发更垂直的行业解决方案中,用户可以通过BigDL PPML,在云上创建一个支持大数据和AI的可信平台环境。在把数据或者模型转移到云上之前,用户可以使用加密技术保护内容,然后通过BigDL PPML直接在加密数据上运行应用软件、模型、Spark数据分析等,PPML会在可信环境中读取加密数据,解密并运行相应的应用,同时确保数据的安全性和应用的完整性。在此基础下,BigDL PPML还可以提供可信的联邦学习(也被称为联合学习)——每一方只拥有一部分信息和功能,但他们可以联合训练一个模型,而不需要向另一方披露数据。通过SGX提供的硬件级的安全环境,联邦学习场景中的性能和安全性能够得到有效保证。

此外,BigDL之上构建的其他垂直行业解决方案还包括Chronos项目——一个利用AutoML技术构建大规模、分布式时间序列分析的应用框架,可用于时序数据的处理,滑动窗口取样、缩放、重采样、补全,以及自动的特征提取。同时,其中内置了大量时序预测和异常检测模型,用户可以直接使用TSDataset构建时序应用进行数据处理,使用对应的模型进行预测或者异常检测。AutoML技术帮助用户搜索最佳的模型参数以提高模型预测的准确性。 Chronos同时内置了Intel的分类加速工具可以帮助用户取得更好的训练与推理速度;以及Friesian项目——用于构建大规模端到端推荐解决方案的应用框架,提供了丰富的内置特征工程操作、推荐算法和参考样例,帮助用户快速构建一个完整的推荐系统来应对离线或者在线的推荐场景。

总而言之,作为一个开源项目,BigDL能够提供端到端大数据人工智能管道,让用户、科学家和数据工程师更容易构建大规模分布式人工智能解决方案,并使其变得更加容易。它还提供各种垂直框架,如推荐、时间序列分析、隐私保护机制,以帮助用户快速整合他们的AI解决方案。或许在并不遥远的未来,伴随着人工智能在人类生活中更加深度的渗透,BigDL与大数据的结合将为我们揭示更多意想不到的神奇真相。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10340

    浏览量

    181340
  • 人工智能
    +关注

    关注

    1821

    文章

    50530

    浏览量

    267798
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137429
  • 大数据
    +关注

    关注

    64

    文章

    9115

    浏览量

    144178
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【技术深挖】EtherCAT如何实现超高精度同步?深度解析分布式时钟 (DC)

    【技术深挖】EtherCAT如何实现超高精度同步?深度解析分布式时钟 (DC)
    的头像 发表于 05-21 13:57 65次阅读
    【技术<b class='flag-5'>深挖</b>】EtherCAT如何实现超高精度同步?深度解析<b class='flag-5'>分布式</b>时钟 (DC)

    AI Ceph 分布式存储教程资料大模型学习资料2026

    的系统工程。通过深度剖析 AI 分布式存储的实战技术,我们构建了一条通往 AGI(通用人工智能)的高速数据公路。在这场科技竞赛中,只有掌握了高性能存储这一关键基建,才能让算力引擎全速运转,让
    发表于 05-01 17:35

    智能体PC时代来临,英特尔亮出哪些硬核实力

    端云协同的混合AI正在成为智能体PC规模化落地的核心方向。在轻薄本、AI Box、Mini PC等多元硬件领域,正推动新型PC从专业工具向大众消费市场。英特尔如何在这一领域布局?推进了哪些落地
    的头像 发表于 04-22 21:08 1.7w次阅读
    <b class='flag-5'>智能</b>体PC时代来临,<b class='flag-5'>英特尔</b>亮出哪些硬核实力

    杰和科技亮相英特尔高峰论坛 以全栈智算方案助力产业智能升级

    ,深入探讨如何依托底层技术创新与生态协同,携手应对产业智能化升级带来的全新挑战与发展机遇。杰和科技作为英特尔尊享级合作伙伴重磅亮相,与英特尔携手践行“共芯远航、智创未来”的合作理
    的头像 发表于 04-09 16:03 554次阅读
    杰和科技亮相<b class='flag-5'>英特尔</b>高峰论坛 以全栈智算方案<b class='flag-5'>助力</b>产业<b class='flag-5'>智能</b>升级

    Dante数字化会议系统、分布式视频系统、“AI”人工智能在会议运维中的应用

    Dante数字化会议系统、分布式视频系统、“AI”人工智能在会议运维中的应用
    的头像 发表于 02-08 14:19 1655次阅读

    香港科技大学与英特尔共建联合实验室,聚焦高能效智能计算

    香港科技大学与英特尔宣布成立“香港科技大学-英特尔联合实验室”(以下简称“联合实验室”)。该实验室将开展为期三年的研究计划,重点探索高能效近存计算架构,以应对人工智能应用在性能与能效方面的挑战。通过
    的头像 发表于 02-05 16:30 873次阅读
    香港科技大学与<b class='flag-5'>英特尔</b>共建联合实验室,聚焦高能效<b class='flag-5'>智能</b>计算

    AI智能硬件的“情绪价值”来了!酷赛智能自研技术,深挖大模型潜能

    一家知名智能终端ODM企业,大力投入人工智能技术的研发,在近期热门的智能陪伴机器人等硬件设计方面,实现“功能陪伴”到“情感陪伴”的跨越升级。   解锁AI陪伴的情感新境界   笔者在
    的头像 发表于 01-13 14:34 4223次阅读
    AI<b class='flag-5'>智能</b>硬件的“情绪<b class='flag-5'>价值</b>”来了!酷赛<b class='flag-5'>智能</b>自研技术,<b class='flag-5'>深挖大</b>模型潜能

    Intewell×Intel 强强联合 | 光亚鸿道亮相2025英特尔生态大会

    化、融合化、绿色化的发展趋势,探索“人工智能+”时代的全新边界。 作为英特尔生态合作伙伴,光亚鸿道受邀参加本届大会,携 “鸿道具身智能机器人解决方案” 重磅亮相“技术及应用成果展”,与英特尔
    的头像 发表于 11-27 14:10 545次阅读
    Intewell×Intel 强强联合 | 光亚鸿道亮相2025<b class='flag-5'>英特尔</b>生态大会

    40个项目脱颖而出!2025英特尔人工智能大赛圆满收官,下一个AI应用浪潮开启

    8月16日,2025英特尔人工智能创新大赛决赛暨颁奖典礼在深圳举行。英特尔副总裁、中国软件技术事业部总经理李映表示:“此次大赛,来自全国2817支年青队伍中有40个优秀团队和作品脱颖而出,围绕工业
    的头像 发表于 08-22 10:56 7980次阅读
    40个项目脱颖而出!2025<b class='flag-5'>英特尔</b><b class='flag-5'>人工智能</b>大赛圆满收官,下一个AI应用浪潮开启

    聚焦液冷痛点:英特尔UQD互换性认证助力数据中心高效发展

    认证的技术创新之道,及其对降低数据中心运维复杂度、提升系统可靠性、助力液冷产业规模化的重要性。 英特尔数据中心与人工智能集团副总裁兼中国区总
    的头像 发表于 08-20 15:25 1566次阅读

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得一提的是, 依托
    的头像 发表于 08-07 14:42 1632次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大模型

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    英特尔发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    处理器的边缘 AI 控制器 和 基于英特尔锐炫 ™ 显卡的边缘智算一体机 ,为工业AI的规模化落地注入强劲动力。 英特尔与诺达佳联合发布边缘AI控制器和边缘智算一体机 英特尔公司客户端
    发表于 06-24 17:50 1607次阅读
    <b class='flag-5'>英特尔</b>发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    CTO、高级首席AI工程师张宇博士 英特尔客户端计算事业部边缘计算CTO、高级首席AI工程师张宇博士在MWC AI终端峰会上指出,边缘将崛起为AI落地的核心场景,而英特尔精准捕捉和把握这一趋势,依托包括
    的头像 发表于 06-20 17:32 1133次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘AI的“<b class='flag-5'>智能</b>引擎”