0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据下,数据要素成为科研的驱动力

ss 来源:大数据在线袁绍龙 作者:大数据在线袁绍龙 2020-11-16 15:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

模拟神经网络,探索人脑上亿个神经元之间是如何连接与工作的,带来每秒高达100TB数据高吞吐量;脑疾病研究中,通过数万份患者数据验证抑郁症与睡眠治理不佳的脑区有重合之处;在自动驾驶车辆每天产生了数十TB数据中训练视觉识别算法;天文专家从数十PB海量数据中分析发现新天体……

如今在科研领域,数据正在发挥着越来越重要的作用。尤其是随着数据采集、存储等技术的不断提升,海量数据的出现彻底改变了传统科研模式。继实验科学、理论科学、计算科学之后,基于“数据密集型科学”的科研新范式在大数据时代下,受到越来越多科研人员的青睐。

在“数据密集型科学”的科研新范式驱动下,高校、科研机构加速构建人工智能与大数据平台、为不同学科提供创新基础设施成为当务之急。但由于科研聚焦前沿研究,且不同学科之间存在着很大的差异性,造成对于数据的计算、采集、存储、管理和利用的需求不尽相同,也让高校的人工智能与大数据平台加速向更高水准演进。

数据要素成为科研的驱动力

科研范式因为大数据而迅速改变。

正所谓是“巧妇难为无米之炊”,即便理论再“高明”、算法再先进,缺乏数据的支持,再好的研究设计都得“半途而废”。如果科研数据越多,研究人员就可以利用大量数据的相关性、可取代因果关系和理论与模型,基于海量数据间的相关性验证更多研究想法和理论,获得更多新知识和新发现。

例如,在当前非常热门的类脑科学研究,有一个重要的方向就是多模态多尺度数据分析理论与应用。首先建立脑成像中心,全套磁共振成像设备对小动物或者人体进行脑成像,不断采集和分析脑科学数据,构建起多模态多尺度脑数据库;然后,在利用模式识别、深度学习等类脑智能方法寻找基因、脑影像和认知功能的诊断指标,以揭示脑疾病致病机制、提升脑疾病临床诊断以及药物疗效评估的准确性和效率。

“目前高校数据量增长的确非常大,很多科研领域对于各种科研数据的收集也非常重视。”复旦大学大数据学院副院长薛向阳教授如是说。

如何理解数据密集型科学与之前计算科学之间的区别,两种科研范式似乎都需要通过大量的计算、数据来完成科学研究。但计算科学通常是先提出可行理论,再搜集数据,之后通过计算仿真进行验证;而数据密集型科学则是先通过采集大量的数据,再通过计算与分析获得新知识和新发现。

“数据密集型科学”的科研新范式核心挑战还在于数据。科研数据的数据密集型,具有不可重复性、高度不确定性、高维、计算高度复杂等特征。如今越来越多科研人员,面临的不是缺少数据的难题,而是海量数据环境下如何存储、管理和利用数据,这对于科研数据底座的存储在容量、性能、扩展和管理等方面提出极高的要求。

薛向阳教授介绍:“我们正在建设一个人工智能与大数据的开放共享平台,就是希望为科研工作者解决数据存储、管理和利用等方面的挑战,让数据更好地为科研所用。”

科研新范式不应被存储所束缚

与其他行业相比,高校与科研机构在建立人工智能与大数据平台时,对于存储的要求更高,往往需要存储这个科研数据基础设施有效解决数据存不下、管不好、用不顺等挑战。

具体来看,如今的高校与科研机构普遍都在加速向“数据密集型科学”的科研新范式转变,多学科、交叉研究的现象很常见,都重视科研数据的采集与存储,直接导致了底层存储的巨大压力。

以脑科学与类脑研究为例,其所产生的数据主要以影像大文件为主,并包含了大量临时小文件数据。由于需要存储的数据量极大,并且始终保持着很高的增长速度,很多科研机构之前采用传统纵向扩展的存储很快出现明显瓶颈;也有一些天文研究机构,一开始寄希望于通过公有云的方式来保存数据,但是随着数据不断积累,通过公有云的方式不仅带来了额外的带宽成本,还存在效率等方面挑战。

“当前很多高校的研究都是基于大数据,首先最关键的是将数据存下来。”薛向阳教授直言道。

除了将数据很好地存下来,高校与科研机构大多都渴望将数据流动与共享起来,但现实情况却是数据管理粗放、不够精细化,数据共享低效、管理困难。比如在高校中,经常会遇到一份科研数据同时被多个课题组所使用,每个课题组都需要拷贝一份数据,在不断科研过程中,又各自产生了大量不同的数据,最后衍生出多种版本,让数据管理的复杂度大幅升上,降低了数据功效与流动的效率。

另外,因为学科的不同,对于存储的性能、功能要求也是千差万别,没有强大的存储做支撑,往往让科研人员用不顺。例如,从事机器视觉研究的人员,对于存储空间极度渴求;模拟脑神经网络相关的研究,当前只能模拟不到5%,要想100%模拟需要100 TB/s的通量,则对于数据存储性能和带宽要求极高,且挑战巨大。薛向阳教授表示:“高校应用偏科学研究,很多应用都较为超前,对于存储功能层面一直会产生新需求和新挑战。”

“一直以来,浪潮都跟国内外多所高校进行紧密合作。高校科研领域的确走在数据存储场景应用的最前沿。”浪潮存储产品线副总经理周川如是说,“浪潮存储有一些新功能、新思路都是在与高校、科研机构的深入合作中产生。”

例如,针对高校多个学科与多个课题组共享、使用、管理数据会产生多份数据的难题,浪潮存储为用户定制的软拷贝功能,在元数据和索引上做变更,用户视角是多份不同的文件,但底层则是共同的存储空间,只有数据修改和写入才会增加新的存储空间,实现多份数据极速拷贝和使用,还大幅降低存储容量开销和管理成本,让数据共享、使用变得更加高效。

浪潮存储资深架构师叶毓睿介绍:“软拷贝功能是浪潮存储在科研场景实践的一个小注脚,它带来了两大直接好处:一是数据共享加速,第二则是提升存储效率。”

新存储让科研新范式步入快车道

今年初,国家正式提出加快数据中心、5G等新型基础设施的建设进度。国家发改委之后则首次指出,创新基础设施为新基建三大范围之一,包括科技基础设施、科教基础设施等,重点支撑科学研究、技术开发等工作。随着中国高校科研费用投入逐年增加,多个科研领域取得诸多突破与成果,创新基础设施的重要性也日渐突出。

为此,浪潮存储今年提出新存储之道,在“云存智用、运筹新数据”理念的基础上,推进“存储即平台”战略,打造存储的极致性能、容量、管理等七大核心能力,为创新基础设施构建坚实的数据底座,让科研新范式进入到发展的快车道。

例如,在一些注重数据存储性能的科研场景,浪潮存储专门为高频访问的元数据和日志数据“开小灶”,采用SSD盘承载元数据和日志数据显著提升热点数据访问速度,并针对不同数据类型的场景进行优化,让每种场景都能够快速访问、使用数据。

又如,针对高校与科研机构运维人员较少、专业度有限的情况,浪潮存储基于智能存储管理平台InView,将人工智能技术融入存储系统,对存储系统进行集中管理、智能监测和故障预测报警,大幅降低科研机构日常的运维工作,并让运维走向自动化和智能化,从而更好地保障各种科研项目的顺利进行。

不仅如此,针对高校科研领域对于数据存储需求趋势,浪潮存储积极调研与深入沟通,在新存储之道中聚焦新架构、新介质和新能力的打造,在EB级容量、亿级IOPS、TB级带宽、7个9可靠性、存储自治等关键新能力上提前布局,为科研的数据底座“厉兵秣马”,提前做好准备。

总体来看,浪潮存储近年来为构建强大的科研新基建不断“加码”,除了复旦大学类脑智能科学与技术研究院、清华大学RUSH、华中科大苏州脑科学研究院、中国天眼等一系列明星科研项目中积累了丰富的实践经验外,还在科研领域打通用户需求洞察、场景功能适配与前沿技术创新,形成良性循环,让科研新范式加速步入发展的快车道。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    491

    浏览量

    25506
  • 储存
    +关注

    关注

    3

    文章

    205

    浏览量

    23184
  • 大数据
    +关注

    关注

    64

    文章

    9116

    浏览量

    144196
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    黑M-狂野大数据5期|网盘无密Mp4+大数据直播课-狂野大数据

    大数据直播成为了提升数据生产力的关键技术之一。它通过实时数据流的采集、分析和呈现,极大地优化了决策效率,推动了创新的步伐。那么,未来大数据
    的头像 发表于 04-06 11:13 292次阅读

    FPGA 模块:工业自动化领域的智能核心驱动力

    工业自动化是现代制造业核心驱动力,通过集成先进控制系统与信息技术,显著提升生产效率、质量及安全性。工业 4.0 ,自动化系统需处理海量数据、执行复杂计算,且需低延迟、高可靠性,而 FPGA 等技术
    的头像 发表于 03-06 18:47 567次阅读
    FPGA 模块:工业自动化领域的智能核心<b class='flag-5'>驱动力</b>

    海光3350便携机主板:大数据处理利器

    随着企业数字化转型加速,大数据处理需求从固定机房向移动场景延伸。无论是金融机构外出调研、科研团队野外数据采集,还是个人创作者处理海量素材,便携设备的性能成为关键。海光便携机主板凭借独特
    的头像 发表于 12-26 11:15 804次阅读

    数据中心发展的三大驱动力

    、可靠的基础支持。相关部门明确了加快5G网络、大数据中心等新型基础设施建设进度, 数据中心发展的三大驱动力 1、中国对于数据中心的政策支持 数据
    的头像 发表于 12-26 10:34 608次阅读

    大数据解决方案如何实施

    大数据解决方案实施的难点在于以下几点:  1.很少有优质可用的数据  在数聚股份看来,这几年数据交易机构如雨后春笋,“数据变现”成为很多拥有
    的头像 发表于 12-25 18:22 1231次阅读

    大数据平台运营的基础是什么

    ,值得每一位企业运营者思考。 本文提供大数据平台运营的三元素模型,旨在帮助企业管理层以全面的视角审视企业当前正在建设的大数据体系,真正地实现数据驱动。 1.    
    的头像 发表于 12-23 16:07 428次阅读

    革新科研智造,引领材料未来——高通量智能科研制备工作站

    应用,推动材料研发从“经验指导”转向“数据驱动”,最终实现研发效能的跨越式提升。 未来,我们将继续秉承“智造·赋能·革新”的理念,助力全球科研单位及企业高效开发新材料、拥抱科研新范式!
    发表于 09-27 14:17

    智慧科研新纪元:善思创兴引领AI与自动化变革

    赋能智能决策与数据分析 | ​信息化构建数字化科研环境 | ​大数据驱动知识挖掘与预测 ​机器人实现精密自动化操作 | ​精密检测技术保障纳米级精准表征 | ​高通量技术加速实验迭代与
    发表于 09-05 16:55

    全自动 PLC 控制系统:工业 4.0 时代的核心驱动力

    工业 4.0 的核心是实现智能制造与数字化工厂,而全自动 PLC(可编程逻辑控制器)控制系统作为工业自动化的 “神经中枢”,通过精准控制、数据互联、智能决策等特性,正在成为这一变革的核心驱动力。从
    的头像 发表于 08-12 16:48 1583次阅读

    AI智能体:推动企业变革的核心驱动力

    在数字经济时代,AI智能体正成为推动企业变革的核心驱动力。作为融合人工智能技术与业务场景的数字化代理,AI智能体通过模拟人类认知与决策能力,为企业创造多维度的价值增长点。这类智能系统不仅能够执行既定
    的头像 发表于 07-29 17:22 922次阅读
    AI智能体:推动企业变革的核心<b class='flag-5'>驱动力</b>

    数据驱动自动驾驶:核心要素与发展全景解析

    在汽车工业向智能化、网联化转型的浪潮中,自动驾驶技术作为人工智能与交通领域深度融合的标志性成果,正重塑全球交通运输格局。数据作为数字经济时代的核心生产要素,已成为自动驾驶系统从理论研发到商业化落地
    的头像 发表于 07-17 11:04 2169次阅读
    <b class='flag-5'>数据</b><b class='flag-5'>驱动</b>自动驾驶:核心<b class='flag-5'>要素</b>与发展全景解析

    RFID无线测温技术:输配电设备智能升级的核心驱动力

    在数字化与智能化飞速发展的时代,智能升级已成为输配电领域的必然趋势。在这一过程中,RFID无线测温技术正崭露头角,成为推动输配电设备智能升级的核心驱动力。无源无线,免维护,高精度与宽温域监测,
    的头像 发表于 07-09 15:31 854次阅读
    RFID无线测温技术:输配电设备智能升级的核心<b class='flag-5'>驱动力</b>

    什么是嵌入式工业平板电脑?聚徽厂家带你一文读懂工业智能化的核心驱动力

    在当今科技飞速发展的时代,工业智能化已成为全球制造业转型升级的关键趋势。在这场智能化变革中,嵌入式工业平板电脑正崭露头角,成为推动工业智能化发展的核心驱动力。它以其独特的优势和广泛的应用,为工业生产带来了前所未有的效率提升、精准
    的头像 发表于 06-25 17:26 869次阅读

    医疗保健领域数字化转型的核心驱动力与主要应用场景

    性和可及性,还推动了远程医疗、智能诊断、个性化治疗等创新模式的发展。本文将您探讨医疗保健领域数字化转型的核心驱动力与主要应用场景,并以Silicon Labs在医疗物联网(IoMT)的应用实例,探讨数字医疗将如何为全球医疗体系带来更高效、智能和可持续的变革。
    的头像 发表于 06-12 14:47 3876次阅读
    医疗保健领域数字化转型的核心<b class='flag-5'>驱动力</b>与主要应用场景

    英泰斯特入选湖北省数据要素型企业

    湖北省数据要素型企业评选旨在挖掘和培育以数据为核心驱动力的标杆企业,推动数据要素市场化配置改革,
    的头像 发表于 05-30 15:04 1254次阅读