0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用深度学习工具来保护非结构化数据

倩倩 来源:百度粉丝网 2020-09-10 10:15 次阅读

产品路线图,合同和公司战略的其他组成部分形式的数百万个文档也代表了内部或云中存储的无结构的脆弱数据,事实证明如此。

一家名为Concentric的数据安全初创公司本周从隐身模式中脱颖而出,声称是第一个使用深度学习工具来帮助公司确定非结构化数据驻留在何处以及如何保护它的公司。在量化数据安全挑战的同时,Concentric还声称其“语义智能”平台可生成洞察力,这些洞察力可用于保护战略数据,同时还可满足数据治理要求。

由业内资深人士创立的这家位于圣何塞的创业公司也在周三(1月29日)宣布了由Clear Ventures牵头的750万美元融资。

Clear Venture的创始人兼管理合伙人克里斯·鲁斯特(Chris Rust)说:“非结构化数据现在是该行业的主要威胁面,因为它高度分散并且以各种形式出现,并且很难保护关键业务内容。”

同心的自动化方法应用深度学习来生成对非结构化数据的语义理解。根据这家初创公司的说法,其框架可以发现,分类和分类业务文档。该初创公司发布的另一份数据风险报告指出,企业数据中心通常包含数百万个不安全的文档,这些文档可能在组织之间不适当地共享。

除了通过“过度共享”防止数据泄露外,该方法还可以保护用户免受与越来越多的数据隐私法规有关的罚款。

安全挑战带来了从薪资信息到源代码的各种非结构化公司数据,而且这种情况正在增长。同心估计,一家普通公司平均可产生约1000万份文档,其中约120万份文档被视为“关键业务”。

根据数据安全性研究,超过80%的企业数据是非结构化的,这意味着它们被嵌入到组织中分布的文档和源代码文件中。随着员工“共享”安全分类不足的数据,这些数据变得更加脆弱。

Concentric首席执行官兼联合创始人Karthik Krishnan表示:“大量数据没有安全保障,无法识别,分类错误并处于风险之中。” “目前,非结构化数据非常丰富且分散,其中包括数量惊人的关键业务信息。”

该初创公司指出,当前用于保护数据库或限制访问的安全框架并不涵盖非结构化数据。考虑到非结构化数据安全性问题的范围,其语义平台寻求使一项任务自动化,而这将使已经应对持续不断的错误警报的IT团队不堪重负。

Concentric没有提供有关其语义智能平台的技术细节,但声称已经扫描了来自金融和医疗保健行业客户的2600万个非结构化数据文件。它的深度学习方法通​​常侧重于过度共享业务文档。该框架采用了一个公式,该公式权衡了由于安全违规和不适当的文档共享而造成的物质损失。

数据安全研究发现,过度共享非结构化公司数据非常重要,因为它“大大增加了威胁面”。

这家初创公司的创始人曾在网络和安全公司工作,包括Aruba Networks,Hewlett Packard Enterprise,Juniper Networks,PGP Corp.及其母公司Symantec。

旨在帮助实现数据安全自动化的机器学习方法在公共和私营部门中都越来越受欢迎。例如,国防高级研究计划局去年宣布了一项努力,以填补企业网络中的安全漏洞。该机构说,例如,在DARPA计划下开发的威胁检测算法可用于对威胁“在不同数据类型和来源的情况下”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动化
    +关注

    关注

    28

    文章

    5040

    浏览量

    77733
  • 数据安全
    +关注

    关注

    2

    文章

    609

    浏览量

    29803
  • 深度学习
    +关注

    关注

    73

    文章

    5239

    浏览量

    119925
收藏 人收藏

    评论

    相关推荐

    什么是结构化网络布线?结构化网络布线有哪些好处?

    在电缆领域,结构化网络布线这个术语经常被提及。人们将其用作流行语,但它的真正含义是什么?结构化布线到底是什么? 为了了解真正的含义,让我们看它的一些相关定义。 根据光纤协会的说法,结构化布线
    的头像 发表于 04-11 11:54 174次阅读

    结构化布线的好处多吗

    结构化布线是网络系统中的重要组成部分,因为它为数据传输提供了强大、可扩展且可靠的基础。通过遵守全球公认的标准,结构化布线可促进高速连接、简化故障排除并确保未来的可扩展性。考虑到这些优势,企业应优先
    的头像 发表于 04-07 11:15 134次阅读

    CFD 设计利器:结构化和非结构化网格的组合使用

    在CFD的发展历史中,结构化网格出现最早,至今仍在使用。结构化网格有几个主要优点,如精度高、生成速度快、单元分布均匀。有些工具擅长绘制这类网格,例如CadenceFidelityAutomesh
    的头像 发表于 12-23 08:12 408次阅读
    CFD 设计利器:<b class='flag-5'>结构化</b>和非<b class='flag-5'>结构化</b>网格的组合使用

    使用关系数据库中的半结构化数据

    NoSQL革命已经进入了关系世界。您可能正在使用关系数据库,但仍必须查询和理解隐藏在文本列、JSON或 XML文档中的半结构化数据
    的头像 发表于 12-20 10:46 274次阅读
    使用关系<b class='flag-5'>数据</b>库中的半<b class='flag-5'>结构化</b><b class='flag-5'>数据</b>

    分布式融合存储解决方案驱动非结构化数据多模计算

    随着5G、AI、大数据等新一代信息技术在千行百业中深度应用,非结构化数据呈来源多样化、维度丰富化、数据量爆炸式增长的特征,
    的头像 发表于 10-30 19:45 383次阅读
    分布式融合存储解决方案驱动非<b class='flag-5'>结构化</b><b class='flag-5'>数据</b>多模计算

    对与性能比较低的51单片机,结构化编程性能提升多少?

    对与性能比较低的51单片机,结构化编程性能提升多少
    发表于 10-26 06:21

    一种结构化道路环境中的视觉导航系统详解

    根据结构化道路环境的特点提出了一种将边沿检测和道路环境知识相结合的机器视觉算法 , 并结合基于行为响应的路径规划方法和智能预瞄控制方法 , 实现了一套基本的机器人视觉导航系统 . 在自主机器人实验
    发表于 09-25 07:23

    深度学习框架的作用是什么

    深度学习框架的作用是什么 深度学习是一种计算机技术,它利用人工神经网络来模拟人类的学习过程。由于其高度的精确性和精度,
    的头像 发表于 08-17 16:10 1174次阅读

    深度学习框架是什么?深度学习框架有哪些?

    深度学习框架是什么?深度学习框架有哪些?  深度学习框架是一种软件
    的头像 发表于 08-17 16:03 1787次阅读

    什么是深度学习算法?深度学习算法的应用

    什么是深度学习算法?深度学习算法的应用 深度学习算法被认为是人工智能的核心,它是一种模仿人类大脑
    的头像 发表于 08-17 16:03 1489次阅读

    结构化数据结构化数据(2)#大数据分析

    数据
    学习硬声知识
    发布于 :2023年07月11日 13:57:24

    结构化数据结构化数据(1)#大数据分析

    数据
    学习硬声知识
    发布于 :2023年07月11日 13:56:39

    使用结构化的PLC变量的工作原理

    要创建结构化的 PLC 变量,首先需要定义一个 PLC 数据类型 (UDT)。 并在该数据类型中声明所需的数据元素并指定它们的名称和数据类型
    发表于 07-10 12:47 568次阅读
    使用<b class='flag-5'>结构化</b>的PLC变量的工作原理

    Python Pandas如何来管理结构化数据

    和DataFrame)。   在人工智能领域,Pandas经常用于机器学习深度学习过程的预处理步骤。Pandas通过提供数据清理、重塑、合并和聚合,可以将原始
    的头像 发表于 05-25 11:22 462次阅读
    Python Pandas如何来管理<b class='flag-5'>结构化</b><b class='flag-5'>数据</b>

    中国研究人员提出StructGPT,提高LLM对结构化数据的零样本推理能力

    尽管结构化数据的体量往往非常巨大,但不可能容纳输入提示中的所有数据记录(例如,ChatGPT 的最大上下文长度为 4096)。将结构化数据线
    的头像 发表于 05-24 16:02 2375次阅读
    中国研究人员提出StructGPT,提高LLM对<b class='flag-5'>结构化</b><b class='flag-5'>数据</b>的零样本推理能力