0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据质量决定了数据对业务的内在价值

悟空智能科技 来源:未知 作者:李倩 2018-06-14 09:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据质量决定了数据对业务的内在价值。信息技术只是这个内在价值的放大镜。因此,高质量的数据与有效的技术相结合是一项巨大的资产,但低质量的数据与有效的技术相结合也是一项巨大的责任。

数据管理需要对数据以及相应的数据定义或元数据进行适当的管理。它旨在确保(元)数据质量良好,因此是有效和高效管理决策的关键资源。数据质量(DQ)通常被定义为“适合使用”,这意味着该概念的相对性质。

在另一个决策环境中,即使是同一个业务用户,原来其质量可接受的数据可能被认为质量较差。例如,分析性销售预测任务的数据可能不能满足会计任务数据的要求。

数据质量决定了数据对业务的内在价值。信息技术只是这个内在价值的放大镜。因此,高质量的数据与有效的技术相结合是一项巨大的资产,但低质量的数据与有效的技术相结合也是一项巨大的责任。这有时也被称为GIGO或“无用输入,无用输出”原理,即使采用了最好的技术,也会导致获得错误数据的结果。

01 信息架构师(也称为信息分析师)

信息架构师负责设计概念数据模型,并与业务用户进行沟通和对话。其弥合了业务流程和IT环境之间的鸿沟,并与可能有助于选择概念数据模型类型(例如EER或UML)和数据库建模工具的数据库设计师密切合作。在数据准确性和数据完整性方面,一个良好的概念数据模型是存储高质量数据的关键要求。

02 数据库设计师

其职责是将概念数据模型转换为逻辑和内部数据模型,协助应用程序开发人员定义外部数据模型的视图,从而有助于数据安全。为了便于将来对数据库应用程序进行维护,数据库设计人员在创建强制实现数据一致性的各种数据模型时,应定义公司范围的统一命名约定。

03 数据管理员

数据管理员是数据质量(DQ)专家,负责确保实际业务数据和相应元数据的质量。他们通过执行广泛和定期的数据质量检查来评估数据质量(DQ)。除其他评估步骤外,这些检查涉及应用或计算最相关的数据质量(DQ)维度的数据质量指标和指标。

显然,他们也需要主动采取行动,并进一步处理这些评估的结果。第一类应采取的措施是采取纠正措施。但是,数据管理员不负责自行更正数据,因为这通常是数据所有者的责任。对数据质量评估结果采取的第二种行动涉及深入调查所发现数据质量问题的根本原因。

了解这些原因可能允许设计旨在消除数据质量问题的预防措施。预防措施可能包括修改数据来源的操作信息系统(例如,使字段成为强制性的,提供可能值的下拉列表,使界面合理化等)。

总体而言,防止错误数据进入系统通常比事后纠正错误更具成本效益。但是,由于输入数据中存在不必要的数据质量问题,因此应注意不要减慢关键流程。

04 数据库管理员(DBA)

其职责是负责实施和监视数据库。其工作内容包括:安装和升级DBMS软件、备份和恢复管理、性能调整和监控、内存管理、复制管理、安全性和授权等。数据库管理员(DBA)与网络和系统管理员密切合作。

其还与数据库设计人员进行交流,以降低运营管理成本,并保证达成一致的服务水平(例如响应时间和吞吐率)。数据库管理员(DBA)可以提供数据可用性和可访问性,以及其他两个关键数据质量维度。

05 数据科学家

数据科学家在数据管理的背景下是一个相对较新的职位。其负责使用最先进的分析技术分析数据,以提供新的见解,例如客户行为。数据科学家具有将ICT技能(如编程)与定量建模(例如统计)、业务理解、沟通和创造力相结合的多学科特征。数据科学家应具备的技能(点击标题查看)

一位优秀的数据科学家应该拥有Java、R、PythonSAS等语言的良好编程能力。编程语言本身并不重要,只要数据科学家熟悉编程的基本概念,并知道如何使用这些来自动执行重复任务或执行特定例程即可。

显然,数据科学家应该有统计学、机器学习和/或定量建模方面的全面背景。从本质上讲,数据科学是一项技术练习。分析模型和商业用户之间往往存在巨大差距。为弥合这一差距,沟通和可视化设施是关键。数据科学家应该知道如何通过使用交通信号灯方法,OLAP(在线分析处理)设施,如果当时的业务规则等以用户友好的方式表示分析模型、附带的统计数据和报告。

数据科学家至少需要两个层面的创造力:在技术层面上,重要的是在数据选择、数据转换和清理方面进行创新。在分析层面上,标准分析过程的步骤必须适应每个特定的应用,而“正确的猜测”往往可以产生很大的差异。分析是一个快速发展的领域。

新的问题、技术和相应的挑战不断涌现。数据科学家必须跟上这些新的发展和技术发展的步伐,并且有足够的创造力来看待他们如何能够创造新的商业机会。这些数据科学家在当今的就业市场很难获得,这并不奇怪。然而,数据科学家有助于提供新的数据和/或见解,这可以让企业利用新的战略商业机会。

总而言之,确保高质量的数据是综合各种技能的多学科练习。在此从数据质量的角度回顾了以下数据管理作业配置文件:信息架构师、数据库设计师、数据所有者、数据管理员、数据库管理员、数据科学家。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据管理
    +关注

    关注

    1

    文章

    333

    浏览量

    20475
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143062

原文标题:大数据5个热门岗位是什么?

文章出处:【微信号:WUKOOAI,微信公众号:悟空智能科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    质量损失的数据迁移:Nikon SLM Solutions信赖3Dfindit企业版

    使用转换器将CAD数据从一个系统传输到另一个系统,但这往往会导致数据质量下降。因此,该公司决定使用3Dfindit企业版将CAD数据迁移到
    发表于 11-25 10:06

    有哪些具体的技术细节需要企业在选择电能质量在线监测装置数据存储方式时注意?

    ” 等环节,这些细节直接决定存储系统的长期稳定与实用价值。具体需注意以下 6 类关键技术细节: 一、数据格式与数据库适配:确保 “数据能存、
    的头像 发表于 10-30 09:56 104次阅读

    2025数据资产管理平台排行榜,数据资产管理平台行业趋势

    在数字化转型进入深水区的今天,数据已成为企业核心生产要素,其价值释放效率直接决定企业竞争力。而数据资产管理平台作为统筹数据采集、治理、服务、
    的头像 发表于 10-18 10:37 788次阅读

    QMS质量管理系统:质检数据如何赋能工厂持续改进?

    质检数据(特别是AI带来的高价值数据)是驱动工厂持续改进的“燃料”,而QMS则是高效管理并燃烧这些燃料,从而产生前进动力的“发动机”。 它确保工厂的每一次
    的头像 发表于 10-14 10:20 192次阅读
    QMS<b class='flag-5'>质量</b>管理系统:质检<b class='flag-5'>数据</b>如何赋能工厂持续改进?

    除了国标和标准,还有哪些因素会影响电能质量在线监测装置的校准周期?

    多维度 “非标准因素” 影响。这些因素通过改变设备精度漂移速度、数据可靠性需求,间接决定校准周期的实际调整方向,具体可分为以下 6 类核心因素: 一、设备自身硬件质量与老化特性(精度
    的头像 发表于 09-26 14:00 319次阅读

    不同的电能质量问题对装置数据验证频率有何影响?

    不同电能质量问题的 发生频率、危害程度、数据稳定性及监测需求紧迫性 存在显著差异,这些特性直接决定专项型电能质量在线监测装置的
    的头像 发表于 09-04 17:20 615次阅读
    不同的电能<b class='flag-5'>质量</b>问题对装置<b class='flag-5'>数据</b>验证频率有何影响?

    大模型时代,如何推进高质量数据集建设?

    质量数据集,即具备高价值、高密度、标准化特征的数据集合。 在AI领域,高质量数据集地位举足轻重,如同原油经炼化成为汽油驱动汽车,海量原始数据
    的头像 发表于 08-21 13:58 525次阅读

    维智科技时空AI技术重塑数据资产价值

    维智科技其核心数据资产价值实现跨越式增长,经上海数据交易所专业机构评估累计价值近1.2亿元。
    的头像 发表于 06-23 14:16 870次阅读

    东软:以数据价值化为破局点 用AI构建城市新基础设施

    近日,在“2025数字城市论坛”上,东软集团轮值CEO徐洪利受邀以《数据价值化赋能城市全域数字化转型》为题发表主旨演讲,系统阐述 东软以智能化和数据
    的头像 发表于 06-18 14:31 489次阅读

    从云端到单机的数据匿名化全攻略

    本文讨论企业如何在保护敏感信息的同时,安全释放视频数据价值,平衡数据安全与业务需求。基于 AWS Kubernetes 的可扩展集群方案和
    的头像 发表于 06-03 13:46 489次阅读
    从云端到单机的<b class='flag-5'>数据</b>匿名化全攻略

    数据标注服务—奠定大模型训练的数据基石

    数据标注是大模型训练过程中不可或缺的基础环节,其质量直接影响着模型的性能表现。在大模型训练中,数据标注承担着将原始数据转化为机器可理解、可学习的信息的关键任务。这一过程不仅
    的头像 发表于 03-21 10:30 2305次阅读

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    数据对于训练增强和优化机器人能力的深度学习模型至关重要。 从财务上讲,用户数据对互联网公司具有重要价值,估计每个用户 600 美元,考虑到大规模商业化后每个机器人的估计成本为 35000 美元,可以
    发表于 12-24 00:33

    可与MES系统集成的数据采集监控平台

    中的问题并进行调整,避免了生产中断和浪费;降低了运营成本,通过优化生产计划和调度,减少了不必要的库存和生产成本;提升了产品质量,通过全流程的质量管理,确保产品质量的稳定性和一致性。
    发表于 12-16 15:08

    如何找到适合的大屏数据可视化系统

    价值。以下是如何选择合适大屏数据可视化系统的详细指南: 首先,明确需求是关键。企业或组织需要明确数据可视化系统的使用目的,包括需要展示的数据类型、
    的头像 发表于 12-13 15:47 802次阅读

    万里红构建“三医”数据底座平台

    研究提供重要资源。然而,目前大部分医疗数据仍处于静态和隔离状态,其潜在价值尚未得到充分利用。党的二十届三中全会《决定》提出,深化医药卫生体制改革,促进医疗、医保、医药协同发展和治理。
    的头像 发表于 12-11 09:38 1216次阅读