0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

玩大数据13年后,他又一次嗅到了风口的味道

QVp5_ceibs_cbr 来源:YXQ 2019-04-18 15:18 次阅读

写代码是爱好,是生存工具,只有当生存不成问题,才能不耻于谈梦想。

1986年出生的马晓东看起来比实际年龄大一些,个子不高,瘦,黑色短款夹克添了老干部范儿,总之,不像个沉迷于大数据的IT男,但很快,他就暴露了。

“你知道本·拉登是怎么被抓到的吗?”

这个故事,他在许多场合说过,他对听众的反馈有信心,随着故事的展开、深入,他们的眼睛会越睁越大,身体前倾,并忍不住提问。

Palantir是美国一家神秘而低调的大数据公司,CIA、NASA、FBI都位列它的客户名单。2011年,Palantir的工程师们像往常一样,坐在屏幕前监测数据。一个小小的“异常”引起了他们的注意,在巴基斯坦一处贫困山区的小医院,出现了一笔昂贵的高端药消费,这令CIA迅速联想到了头号猎物奥萨马·本·拉登,缩小了包围圈,最终在喀布尔350公里外将他击毙。

在讲述本·拉登丧命经过的《终结》(TheFinish)一书中,作者马克·鲍登(MarkBowden)写道,Palantir公司的软件是“名副其实的杀手级应用”。

在马晓东的想象中,像Palantir这样估值百亿美元的独角兽是他的学习榜样,尽管6年前初创国云数据科技有限公司时,Palantir还是一个陌生的单词。

出走

2016年阿里巴巴提出中台概念,其核心是建设全域大数据。所谓“全域大数据”,指的是阿里生态中的各个业态产出的一切数据。中台要实现的是:利用全域大数据驱动业务,让数据发挥更大价值。

最经典的例子是千人千面的手淘,比爱人更懂你的相关推荐背后,是对数据的解析和处理。中台不仅打通了数据和业务之间的隔阂,并且,数据刺激业务增长,增长反哺新的数据,形成良性闭环。

马晓东从湖南大学计算机系毕业后,进入阿里巴巴,职务是淘宝数据平台架构师,参与大数据框架构建,平台包括支付宝、阿里P2P、天猫、淘宝等在内的所有阿里数据。2010年,企业大数据平台上盘踞多个境外知名软件公司并不是什么新鲜事,阿里也不例外。

那是IOE的时代。IOE,是对IBM、Oracle、EMC的简称,其中IBM代表硬件以及整体解决方案服务商,Oracle代表数据库,EMC代表数据存储。

“基本上一个环节一家公司,光给Oracle的服务费一年就一个亿。”马晓东回忆。

昂贵还不是最大的问题。国际巨头们之前服务的多是制造业客户,对中国的海量互联网数据缺乏操作经验。双十一、抢红包、秒杀,动辄好几亿人同时干一件事,传统的IOE架构成为系统的瓶颈。这是阿里下定决心取而代之的契机,发起了著名的“去IOE”革命。

彼时,从成百上千件商品中挑选出符合推广条件的十几样,再将它们精准营销,需要经历数据分析、建模、技术人员开发的漫长周期,往往是结果出来了,热点也过了。淘宝的数据分析团队、技术团队整天忙于应对前端业务人员提交的“订单”,今天是放心的奶粉,明天是美味的狗粮,重复写难度不高的代码,是一种变相的人力资源挥霍。

马晓东察觉到了这个痛点,他和几个朋友一起,浏览了阿里过去十年做过的数据挖掘,发现其中相当一部分是基础的日常分析,不需要十分复杂的算法。他由此萌生了做一个傻瓜式平台的想法,降低大数据的应用门槛,把挖金子的工具交到业务人员的手里。

平台推出后,阿里内部的反馈出乎意料得好,马晓东升至最年轻的核心数据项目负责人,直接向副总裁汇报。

他放弃四倍薪水的挽留,选择了“单飞”,“有句话叫‘欲使人灭亡,必先让其疯狂’,当时一门心思想做一个最牛的可以改变世界的产品,你觉得你能做扎克伯格,为什么要留在公司呢?”

错过

在国云数据位于苏州工业园区的办公室里,马晓东在9块液晶显示器合成的大屏幕上向我展示城市大脑,物理意义上的城市通过信息技术采集的数据,抽象为虚拟城市,数据进入城市大脑,由大脑做决策,从交通信号灯的控制到城市产业布局,让城市变得更加安全、高效、温暖。

罗马不是一天建成的。

离开阿里后,马晓东和一群极客伙伴们开启了烧钱之旅,多数是本科时认识的,也有之前在阿里结识的知根知底的同事。一百多人的团队在一开始的两年半里,每天8:00-22:00,每个月工资800元,即使在发不出工资的时候,也从未停过工,没有人用脚投票离开。

这股凝聚力可以追溯到湖南大学。2006年,云计算的火热程度堪比当下的人工智能,马晓东组建了云计算工作室,不收会费,但要通过选拔才能加入。工作室参与了与谷歌、IBM合作的大数据分布式计算技术商业项目,同时在国家云计算重点实验室与国内外学者一起参与国家863云计算大数据研发项目。

“我们这帮人很无聊。”一次TED演讲上,马晓东用自嘲向台下西南政法大学的学子描述自己不同寻常的校园经历,5点起床,跑步上岳麓山,登顶后读《少年中国说》,“特别二,一帮男生,下山后我们不是敲木鱼,集体写代码。”

写代码是爱好,是生存工具,只有当生存不成问题,才能不耻于谈梦想。

2013年初,大数据分析平台“大数据魔镜”上线,分为云平台版、基础企业版、标准企业版、高级企业版和Hadoop版。其中云平台版为永久免费SaaS版,提供常用数据分析模型和算法,能实现500多种可视化效果。“让人人都能用上大数据”是它的slogan,如今出现在办公区上方垂挂的KT板上,辅以漫威英雄的形象。

产品做出来了,却没钱推广。最窘迫的时候,他们意外获得了一笔价值90万的“救命”订单,“(订单)要求和我们真正想做的东西差太远了,就给拒了。”马晓东一狠心,把自己唯一的一套房卖了,勉强填上了资金的窟窿。

在2013年Gartner发布的十大科技趋势中,战略性大数据位列其中。Gartner预测,大数据将与社会化网络结合。互联网上最丰富的五大数据资源分别是社交图谱、意向图谱、消费图谱、兴趣图谱和移动图谱。传统单一企业数据仓库的概念已经过时,大数据需要多种系统的整合。

技术创业者有时需要守着引以为傲的产品等待被广为知晓和理解的时刻。2017年9月,国云数据完成1.08亿元的B轮融资,创业4年获融资总额近1.3亿元人民币。大数据魔镜有15000家B端用户,行业覆盖军工、政府、企业等类型。为华为定制一款多地服务器的安全监控应用,前后只需要两天时间,颠覆了传统软件开发的逻辑。

但也不是没有遗憾。

马晓东坦言错过了6年前的那场“风口”。“当时投资界数一数二的人找我吃饭,我总说‘还在专心弄产品’,也不是说‘佛系’,只是当时没有经历过完整的创业周期,认知上有漏洞。”

未能主动布局融资和营销,外界看来,国云数据的扩张速度缓慢,资金压力一直都在,反过来看,倒也给了马晓东不断在最小单元试错的机会,摸索出高人效的战略。“钱多会遮蔽企业的短板,要么像扎克伯格那样一战成名,要么像OFO那样轰轰烈烈倒下。”

风口

大数据在多数人眼里是一个既万能又高大上的存在,似乎什么都可以做,但又不知道能做什么,怎么做。卫报称它为当代的“石油”,在互联网时代,推动着世界滚滚向前。和石油类似,数据同样需要采集、获取、提炼,加工、交易、应用,同样,也需要面对反垄断调查。

马晓东有一个更接地气的比喻解释大数据应用,做菜。数据是食材,第一步收集,将IT系统、微信、微博……产生的数据传到中央厨房的仓库;第二步开发,数据清洗、建模型分析、数据挖掘,类似洗菜、切菜、烹饪。大数据魔镜及国云数据中台内置了多种数据分析算法和模型,用户只需要拖拽数据维度和度量,就可以观察、发现数据之间的关联。

大数据应用的门槛消失了。

世界上90%的数据都是在过去的两年产生的,在人类产生的所有数据信息中,只有0.5%被分析处理过,有大量数据等待挖掘。对于世界500强企业,每增加10%数据获取量,将提升超过6500万美元的净收入。

还在阿里的时候,马晓东记得,马云来他们部门,说“你们怎么把这个数据搞点价值”,阿里金融被视为一场对传统银行业的颠覆,互联网的海量数据和基于用户行为的信用体系是阿里金融的根基。2018年,蚂蚁金服估值千亿美金,超过了百度。

大数据技术前期投入特别大,技术接口,个性化定制非常耗时耗精力,不是普通草根创业者玩的地方。2B的方向是一开始就定下的,它不及2C热度高、性感,马晓东研究过,美国市场上的同行,平均上市花费的时间都在十年以上。好处也很明显,每一步走得稳健,获得华为这样的优质的标杆客户之后,他庆幸自己活下来了。

经济学家许小年比较过2B和2C企业基因上的不同,前者自下而上,从车间开始,逐渐做到云端,讲行业知识,后者自上而下,先建平台,讲DAU、MAU、生态。

4年前,国云数据开始建中国乳业大数据平台,来自政府的千万大单对初创公司而言可谓梦幻,对程序员来说,天苍苍,野茫茫,风吹草低见牛羊第一次不再是计算机桌面,而是复杂的现实。饲料槽纪录每头牛吃草的数据,牛身上配有的“手环”纪录发情时间,把一家传统牧场改造成智慧牧场需要100万元,牧场数量是4000家。大数据平台搭建后,产奶量的预测将更精准,奶价制定过程将更科学,奶农、奶企将从中受益。这个商业闭环的形成耗时费力,却是一个典型的大数据推动供给侧改革和产业升级的故事。

2018年,一批受资本追捧的消费互联网企业的倒掉,让市场重新打量2B企业,“赋能”是其中的关键词。数字化转型的口号喊了多年,企业还在为数据用不起来而苦恼。大多数企业对数据服务是有需求的,比如网站数据、销售数据、ERP数据、财务数据等等,但没有自己的数据团队。传统的软件公司提供不了系统的大数据服务。马晓东相信,大数据魔镜和垂直行业深度结合,前景广阔。

今年初,多家银行找到国云数据,面对互联网金融的冲击,他们急于盘活存量,深度挖掘客户需求,国云数据中台及魔镜大数据成为他们拥抱大数据的抓手,某种程度上,一根求生存的重要绳索。马晓东开始思考新的商业模式,比如以很低的价格提供软件和服务,随后跟银行谈分成。

玩大数据13年后,他又一次嗅到了风口的味道。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1571

    浏览量

    46420
  • 大数据
    +关注

    关注

    64

    文章

    8630

    浏览量

    136567

原文标题:玩大数据13年后,他嗅到了“风口”

文章出处:【微信号:ceibs-cbr,微信公众号:中欧商业评论】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    配置SPI一次收发个16位数据,但抓的数据波形显示,数据连续发送和接收了4为什么?

    我配置SPI一次收发个16位数据,但抓的数据波形显示,数据连续发送和接收了4,这个情况有碰到
    发表于 04-18 07:52

    输入捕获实验是如何判断溢出了呢?

    请问,在刚刚捕获上升沿的时候,如果溢出了,在我圈的最后行里会出现STA++,表示溢出了一次,可是,到底是如何判断溢出了呢?上面只是写了,捕获到高电平
    发表于 04-08 07:10

    DMA传输的ADC采样数据总是上一次数据,为什么?

    的,我通过模拟看门狗检测电压变化,当超限时将DMA把ADC采样到的数据传输出去,但是经过debug调试和示波器的观察,我可以明显的看出ADC[]数组里面的值是上一次电压变化的值。 而开机,第
    发表于 03-15 06:52

    STM32G030在使用串口中断接收时,发现串口接收一次数据,第二进不去中断的原因?

    在使用串口中断接收时,发现串口接收一次数据,第二进不去中断了,初始化开启了中断且在回调函数里面也再次开启了中断,但是效果依旧只能接收一次串口数据
    发表于 03-08 07:40

    PSoC™ 6 UART通信反复发送字符串是为什么?

    我正在尝试使用 UART 代码,但我修改了代码,一次又一次地发送字符串,而这次只询问用户一次。 所以我想再三询问用户。 我还设置了个 while (1) 循环,但仍然不起作用。 因
    发表于 03-05 07:26

    请问下qspi mtsr引脚传输一次32bit引脚不拉低怎么解决?

    如果初始电平为低,传输结束引脚变高;然后下一次传输引脚变低,依次循环。在这期间中断计数器cmp0不累加, 40s变化一次数据传输
    发表于 02-06 06:20

    XMC4700 Relax KIT_A2G_TC387_MOTORCTR DAVE™ 4.2.2如何验证读取保护?

    你好!我正在使用 XMC4700 Relax KIT_A2G_TC387_MOTORCTR DAVE™ 4.2.2。 我想开启读取保护,这样你就可以在需要时一次又一次地上传代码。 另外,请告诉我如何验证读取保护?
    发表于 01-19 07:05

    如何只写一次数据就让AD5421的输出电流保持住?

    请问大虾: 现象:连续写AD5421的数据寄存器,可以使AD5421输出电流保持住。但是只写一次数据寄存器,AD5421的输出电流无法保持,但是读数据寄存器时,寄存器的值是写进去的值。 问题:如何只写
    发表于 12-19 08:24

    AD7124-4每次启动转换,读到的数据总是前一次的结果怎么解决?

    ) data_buf; (浮点数) data_buf; (浮点数) data_buf; (浮点数) data_buf; (浮点数) data_buf; (浮点数) data_buf;) } 问题: 每次启动转换,读到的数据总是前
    发表于 12-15 08:22

    AD7656使用在串行模式输出,复位一次转换并读取的数据只有真实值的半是为什么?

    AD7656使用在串行模式输出,但每次复位,第一次转换并读取的数据只有真实值的半,从第二开始,之后的每次转换得到的
    发表于 12-11 08:24

    串口收发,上电一次总是多个FF字节怎么解决?

    串口1 收发,上电一次收到的数据 总是多个FF,导致后面数据乱了,但是在仿真状态是,收发是正常的,如下图。望大家多多指点。谢谢! 调
    发表于 10-20 08:27

    USB带电状态下枚举一次数据上传,PC收不到是为什么?

    各位大佬好,我在工作使用NUC123这款设备,发现芯片带电情况下进行USB枚举的第一次的上传数据, PC有几率收不到,通过Debug发现设备发送了,但是PC就是没收到。 于是在NUC123例程
    发表于 08-22 06:46

    DMA传输的ADC采样数据为什么总是上一次数据

    的,我通过模拟看门狗检测电压变化,当超限时将DMA把ADC采样到的数据传输出去,但是经过debug调试和示波器的观察,我可以明显的看出ADC[]数组里面的值是上一次电压变化的值。 而开机,第
    发表于 08-04 09:46

    NTPClient为什么只有第一次调用“timeClient.update”时日期部分是错误的吗?

    我在 NTPClient 库中遇到了个奇怪的问题,几个月来它直没有问题。 我建造了个小型太阳能气象站,配备了些传感器和
    发表于 05-12 07:35

    使用node.dsleep导致立即重启的原因?

    ,tmr.ALARM_SINGLE,startup) 计时器按预期工作并在启动前等待 5 秒。 但在启动,它会导致无法读取的错误消息并一次又一次地重新启动。我正在使用 frightanic.com分支
    发表于 05-09 12:43