0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据和云计算及人工智能的详细资料简介

Wildesbeast 来源:今日头条 作者:PythonSunrise 2020-02-12 10:07 次阅读

今天跟大家讲讲云计算、大数据和人工智能。为什么讲这三个东西呢?因为这三个东西现在非常火,并且它们之间好像互相有关系:一般谈云计算的时候会提到大数据、谈人工智能的时候会提大数据、谈人工智能的时候会提云计算……感觉三者之间相辅相成又不可分割。但如果是非技术的人员,就可能比较难理解这三者之间的相互关系,所以有必要解释一下。

一、云计算
我们首先来说云计算。云计算最初的目标是对资源的管理,管理的主要是计算资源、网络资源、存储资源三个方面。

1.管理数据中心就像配电脑

什么叫计算、网络、存储资源?

比如你要买台笔记本电脑,是不是要关心这台电脑是什么样的CPU?多大的内存?这两个就被我们称为计算资源。

这台电脑要上网,就需要有个可以插网线的网口,或者有可以连接我们家路由器的无线网卡。您家也需要到运营商比如联通、移动或者电信开通一个网络,比如100M的带宽。然后会有师傅弄一根网线到您家来,师傅可能会帮您将您的路由器和他们公司的网络连接配置好。这样您家的所有的电脑、手机、平板就都可以通过您的路由器上网了。这就是网络资源。


您可能还会问硬盘多大?过去的硬盘都很小,大小如10G之类的;后来即使500G、1T、2T的硬盘也不新鲜了。(1T是1000G),这就是存储资源。

对于一台电脑是这个样子的,对于一个数据中心也是同样的。想象你有一个非常非常大的机房,里面堆了很多的服务器,这些服务器也是有CPU、内存、硬盘的,也是通过类似路由器的设备上网的。这时的问题就是:运营数据中心的人是怎么把这些设备统一的管理起来的呢?

2.灵活就是想啥时要都有,想要多少都行

管理的目标就是要达到两个方面的灵活性。具体哪两个方面呢?

时间灵活性:想什么时候要就什么时候要,需要的时候一点就出来了;

空间灵活性:想要多少就有多少。需要一个太很小的电脑,可以满足;需要一个特别大的空间例如云盘,云盘给每个人分配的空间动不动就很大很大,随时上传随时有空间,永远用不完,也是可以满足的。

小编是一个python开发工程师,我这里有一套最新的python基础学习教程,想学习python的小伙伴思信我“01”领取哦~

3.虚拟化的半自动和云计算的全自动

要说虚拟化软件解决了灵活性问题,其实并不全对。因为虚拟化软件一般创建一台虚拟的电脑,是需要人工指定这台虚拟电脑放在哪台物理机上的。这一过程可能还需要比较复杂的人工配置。所以使用VMware的虚拟化软件,需要考一个很牛的证书,而能拿到这个证书的人,薪资是相当高,也可见复杂程度。

所以仅仅凭虚拟化软件所能管理的物理机的集群规模都不是特别大,一般在十几台、几十台、最多百台这么一个规模。

这一方面会影响时间灵活性:虽然虚拟出一台电脑的时间很短,但是随着集群规模的扩大,人工配置的过程越来越复杂,越来越耗时。另一方面也影响空间灵活性:当用户数量多时,这点集群规模,还远达不到想要多少要多少的程度,很可能这点资源很快就用完了,还得去采购。

所以随着集群的规模越来越大,基本都是千台起步,动辄上万台、甚至几十上百万台。如果去查一下BAT,包括网易、谷歌、亚马逊,服务器数目都大的吓人。这么多机器要靠人去选一个位置放这台虚拟化的电脑并做相应的配置,几乎是不可能的事情,还是需要机器去做这个事情。

人们发明了各种各样的算法来做这个事情,算法的名字叫做调度(Scheduler)。通俗一点说,就是有一个调度中心,几千台机器都在一个池子里面,无论用户需要多少CPU、内存、硬盘的虚拟电脑,调度中心会自动在大池子里面找一个能够满足用户需求的地方,把虚拟电脑启动起来做好配置,用户就直接能用了。这个阶段我们称为池化或者云化。到了这个阶段,才可以称为云计算,在这之前都只能叫虚拟化。

4.云计算的私有与公有

云计算大致分两种:一个是私有云,一个是公有云,还有人把私有云和公有云连接起来称为混合云,这里暂且不说这个。

私有云:把虚拟化和云化的这套软件部署在别人的数据中心里面。使用私有云的用户往往很有钱,自己买地建机房、自己买服务器,然后让云厂商部署在自己这里。VMware后来除了虚拟化,也推出了云计算的产品,并且在私有云市场赚的盆满钵满。

公有云:把虚拟化和云化软件部署在云厂商自己数据中心里面的,用户不需要很大的投入,只要注册一个账号,就能在一个网页上点一下创建一台虚拟电脑。例如AWS即亚马逊的公有云;例如国内的阿里云、腾讯云、网易云等。

二、大数据拥抱云计算

在PaaS层中一个复杂的通用应用就是大数据平台。大数据是如何一步一步融入云计算的呢?

1.数据不大也包含智慧

一开始这个大数据并不大。原来才有多少数据?现在大家都去看电子书,上网看新闻了,在我们80后小时候,信息量没有那么大,也就看看书、看看报,一个星期的报纸加起来才有多少字?如果你不在一个大城市,一个普通的学校的图书馆加起来也没几个书架,是后来随着信息化的到来,信息才会越来越多。

首先我们来看一下大数据里面的数据,就分三种类型,一种叫结构化的数据,一种叫非结构化的数据,还有一种叫半结构化的数据。

结构化的数据:即有固定格式和有限长度的数据。例如填的表格就是结构化的数据,国籍:中华人民共和国,民族:汉,性别:男,这都叫结构化数据。

非结构化的数据:现在非结构化的数据越来越多,就是不定长、无固定格式的数据,例如网页,有时候非常长,有时候几句话就没了;例如语音,视频都是非结构化的数据。

半结构化数据:是一些XML或者HTML的格式的,不从事技术的可能不了解,但也没有关系。

其实数据本身不是有用的,必须要经过一定的处理。例如你每天跑步带个手环收集的也是数据,网上这么多网页也是数据,我们称为Data。数据本身没有什么用处,但数据里面包含一个很重要的东西,叫做信息(Information)。

所以数据的应用分这四个步骤:数据、信息、知识、智慧。

最终的阶段是很多商家都想要的。你看我收集了这么多的数据,能不能基于这些数据来帮我做下一步的决策,改善我的产品。例如让用户看视频的时候旁边弹出广告,正好是他想买的东西;再如让用户听音乐时,另外推荐一些他非常想听的其他音乐。

三、人工智能拥抱大数据

1.机器什么时候才能懂人心

虽说有了大数据,人的欲望却不能够满足。虽说在大数据平台里面有搜索引擎这个东西,想要什么东西一搜就出来了。但也存在这样的情况:我想要的东西不会搜,表达不出来,搜索出来的又不是我想要的。

例如音乐软件推荐了一首歌,这首歌我没听过,当然不知道名字,也没法搜。但是软件推荐给我,我的确喜欢,这就是搜索做不到的事情。当人们使用这种应用时,会发现机器知道我想要什么,而不是说当我想要时,去机器里面搜索。这个机器真像我的朋友一样懂我,这就有点人工智能的意思了

人们很早就在想这个事情了。最早的时候,人们想象,要是有一堵墙,墙后面是个机器,我给它说话,它就给我回应。如果我感觉不出它那边是人还是机器,那它就真的是一个人工智能的东西了。

2.让机器学会推理

怎么才能做到这一点呢?人们就想:我首先要告诉计算机人类的推理的能力。你看人重要的是什么?人和动物的区别在什么?就是能推理。要是把我这个推理的能力告诉机器,让机器根据你的提问,推理出相应的回答,这样多好?

其实目前人们慢慢地让机器能够做到一些推理了,例如证明数学公式。这是一个非常让人惊喜的一个过程,机器竟然能够证明数学公式。但慢慢又发现其实这个结果也没有那么令人惊喜。因为大家发现了一个问题:数学公式非常严谨,推理过程也非常严谨,而且数学公式很容易拿机器来进行表达,程序也相对容易表达。

然而人类的语言就没这么简单了。有些时候同一句话在不同场合表达的意思是不一样的,这个时候就只有人能够理解,机器是无法理解的。

3.教给机器知识

因此,仅仅告诉机器严格的推理是不够的,还要告诉机器一些知识。但告诉机器知识这个事情,一般人可能就做不来了。可能专家可以,比如语言领域的专家或者财经领域的专家。

语言领域和财经领域知识能不能表示成像数学公式一样稍微严格点呢?例如语言专家可能会总结出主谓宾定状补这些语法规则,主语后面一定是谓语,谓语后面一定是宾语,将这些总结出来,并严格表达出来不就行了吗?后来发现这个不行,太难总结了。

4.人工智能需要大数据

人工智能可以做的事情非常多,例如可以鉴别垃圾邮件、鉴别黄色暴力文字和图片等。这也是经历了三个阶段的:

第一个阶段依赖于关键词黑白名单和过滤技术,包含哪些词就是黄色或者暴力的文字。随着这个网络语言越来越多,词也不断地变化,不断地更新这个词库就有点顾不过来。

第二个阶段时,基于一些新的算法,比如说贝叶斯过滤等,你不用管贝叶斯算法是什么,但是这个名字你应该听过,这个一个基于概率的算法。

第三个阶段就是基于大数据和人工智能,进行更加精准的用户画像和文本理解和图像理解。

由于人工智能算法多是依赖于大量的数据的,这些数据往往需要面向某个特定的领域(例如电商,邮箱)进行长期的积累,如果没有数据,就算有人工智能算法也白搭,所以人工智能程序很少像前面的IaaS和PaaS一样,将人工智能程序给某个客户安装一套,让客户去用。因为给某个客户单独安装一套,客户没有相关的数据做训练,结果往往是很差的。

但云计算厂商往往是积累了大量数据的,于是就在云计算厂商里面安装一套,暴露一个服务接口,比如您想鉴别一个文本是不是涉及黄色和暴力,直接用这个在线服务就可以了。这种形势的服务,在云计算里面称为软件即服务,SaaS (Software AS A Service)

于是工智能程序作为SaaS平台进入了云计算。

四、基于三者关系的美好生活

终于云计算的三兄弟凑齐了,分别是IaaS、PaaS和SaaS。所以一般在一个云计算平台上,云、大数据、人工智能都能找得到。一个大数据公司,积累了大量的数据,会使用一些人工智能的算法提供一些服务;一个人工智能公司,也不可能没有大数据平台支撑。

所以,当云计算、大数据、人工智能这样整合起来,便完成了相遇、相识、相知的过程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云计算
    +关注

    关注

    38

    文章

    7333

    浏览量

    135641
  • 人工智能
    +关注

    关注

    1775

    文章

    43693

    浏览量

    230480
  • 大数据
    +关注

    关注

    64

    文章

    8631

    浏览量

    136568
收藏 人收藏

    评论

    相关推荐

    如何在人工智能机器人领域应用大数据

    ` 本帖最后由 uoou 于 2015-11-13 16:42 编辑 为了多来点干货,我写的思路会有点特别:不直接讲大数据是怎么做的,我会跳出来讲,在人工智能机器人这个方向,把握好哪三个点
    发表于 11-13 16:37

    智能电器中的大数据/人工智能开发和应用

    ,基于智能电器实操案例,探索如何借助大数据人工智能提高智能产品的品质和智能化的进程,实现技术与产品结合的快速落地。大咖授课黄明机智
    发表于 06-29 14:11

    数据人工智能发展的重要性

    件事情里特别核心的一件就是大数据中心和人工智能算法的整合。让我们一起来引领人工智能大数据时代的来临。 在未来大量数据的融入、
    发表于 10-09 15:26

    全新一代人工智能计算引擎MaxCompute杭州开服,强化阿里大数据能力,比肩谷歌微软

    摘要: 3月22日,阿里将正式开服售卖华东1(杭州)节点的大数据计算服务MaxCompute,以进一步提升对华东区域客户服务的响应速度,推动杭州大数据
    发表于 03-28 14:33

    「深圳云栖大会」大数据时代以及人工智能推动下的阿里异构计算

    摘要: 最近几年,在大数据人工智能的推动下,异构计算有了长足的发展。无论是在产品形态上,还是在应用领域上,阿里异构计算都取得了累累硕果。
    发表于 04-04 13:44

    什么是基于计算人工智能服务?

    如今,采用人工智能的企业遇到了一个主要障碍,那就是在内部开发人工智能产品成本高昂,因此有了外包人工智能产品的需求。而对于从中小企业到预算受限的大型企业来说,通过
    发表于 09-11 11:51

    人工智能大模型、应用场景、应用部署教程超详细资料

    人工智能是IC行业近几年的热词,目前此技术已经有很多成熟的模型和落地案例。在此跟大家做个分享,更多详细资料,请自行搜索:【展锐坦克邦】,坦克邦-智算天地集算法模型、部署说明于一体,为广大客户提供了
    发表于 11-13 14:49

    信立物联网的产品详细资料简介免费下载

    本文档的主要内容详细介绍的是信立物联网的产品详细资料简介免费下载。
    发表于 09-20 08:00 6次下载
    信立物联网的产品<b class='flag-5'>详细资料简介</b>免费下载

    面向51单片机的Keil uVision4基本数据类型的详细资料简介

    本文档的主要内容详细介绍的是面向51单片机的Keil uVision4基本数据类型的详细资料简介
    发表于 07-15 17:39 3次下载
    面向51单片机的Keil uVision4基本<b class='flag-5'>数据</b>类型的<b class='flag-5'>详细资料简介</b>

    51单片机的基本数据类型详细资料简介

    本文档的主要内容详细介绍的是51单片机的基本数据类型详细资料简介
    发表于 06-17 17:44 0次下载
    51单片机的基本<b class='flag-5'>数据</b>类型<b class='flag-5'>详细资料简介</b>

    计算大数据及人工智能详细资料讲解

    今天跟大家讲讲云计算大数据人工智能。为什么讲这三个东西呢?因为这三个东西现在非常火,并且它们之间好像互相有关系:一般谈云计算的时候会提到大数据
    的头像 发表于 05-03 13:25 3922次阅读
    云<b class='flag-5'>计算</b>和<b class='flag-5'>大数据</b><b class='flag-5'>及人工智能</b>的<b class='flag-5'>详细资料</b>讲解

    计算机的二进制概念和进制运算的详细资料简介

    本文档的主要内容详细介绍的是计算机的二进制概念和进制运算的详细资料简介
    发表于 12-11 17:34 15次下载
    <b class='flag-5'>计算</b>机的二进制概念和进制运算的<b class='flag-5'>详细资料简介</b>

    Qt Creator的详细资料简介

    本文档的主要内容详细介绍的是Qt Creator的详细资料简介包括了:1 Qt Creator的下载和安装2 Qt Creator环境介绍3 Qt工具简介
    发表于 12-26 16:59 32次下载
    Qt Creator的<b class='flag-5'>详细资料简介</b>

    STM32串口实验的详细资料简介

    本文档的主要内容详细介绍的是STM32串口实验的详细资料简介主要内容包括了:Systick原理和配置方法, ALIENTEK 延时函数delay讲解
    发表于 01-02 08:00 1次下载
    STM32串口实验的<b class='flag-5'>详细资料简介</b>

    S50非接触式IC卡的详细资料简介

    本文档的主要内容详细介绍的是S50非接触式IC卡的详细资料简介
    发表于 09-09 15:33 17次下载
    S50非接触式IC卡的<b class='flag-5'>详细资料简介</b>