0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

汇总在事件抽取方向的相关厂商调研结果

深度学习自然语言处理 来源:AI算法小喵 作者:AI算法小喵 2022-07-07 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

写在前面

本篇不具体谈技术,主要是汇总在事件抽取方向的相关厂商调研结果。

1. 事件抽取范畴、范式、技术栈

领域范畴:厂商无论是在特定领域(如:法律、金融),还是通用领域,厂商做的都是限定类型的事件抽取。

范式:除标准抽取外(即事件检测和事件论元识别),还有:仅抽取触发词和论元;仅抽取事件类型和论元。在论元抽取上也各不相同,有的仅抽取主体,有的抽取通用属性(如:时间/地点,或者时间/地点/主体/客体)等。

技术栈:

预训练语言模型+(BiLSTM)+CRF

预训练语言模型+MRC

预训练语言模型+Biaffine

Bert+BiLSTM+Self-Attention+Pointer Network

预训练语言模型+指针结构+CLN(ConditionalLayerNorm)等

2. 相关厂商汇总

2.1 华为云

领域范畴

华为云/自然语言处理服务接口说明/事件抽取[1]目前只支持金融公告中的会议召开、聘任、辞职、股票增持、股票减持5类事件以及相关要素的抽取。

范式(标准事件抽取)

包括事件检测(触发词抽取事件类型判定) 事件论元识别(论元抽取论元角色判定)

技术栈

未找到直接描述,但找到了华为云作为CCKS 2020篇章事件要素抽取比赛冠军的方案解析[2],但注意这个比赛不属于标准的事件抽取。

93cfbf0e-fced-11ec-ba43-dac502259ad0.png

940c94b0-fced-11ec-ba43-dac502259ad0.png

94254078-fced-11ec-ba43-dac502259ad0.png

上图分别是他们的整体框架图和子模型图,他们将这个任务拆解了三个子任务:事件类型预测,事件要素抽取,以及事件表格填充。

值得关注的是在论元提取(要素抽取)阶段,除了CRF外,他们也尝试了MRC(阅读理解范式)、Biaffine。其中Biaffine思想来自论文Named Entity Recognition as Dependency Parsing[3]。

另外在最后表格填充时,他们也采用了特殊处理。

2.2 百度

领域范畴

百度AI/知识图谱/事件图谱/事件属性抽取[4]从资讯的标题与正文中,抽取事件发生时间、地点、参与者、触发词等事件元素。应该未限定领域范畴。

范式和技术栈

未找到直接描述,但可从其报告百度: 事件图谱技术与应用[5]分析:

通用属性抽取针对时间、地点、参与者、触发词进行抽取,采用的是实体识别常用的预训练语言模型(ERNIE)+BiLSTM+CRF;

943a5940-fced-11ec-ba43-dac502259ad0.png

自定义论元抽取采用MRC(阅读理解)方式,将抽取转换成问答形式,通过问题嵌入要抽取的目标,如某角色的论元,来解耦了模型与事件类型、角色类型的相关部分;

94590fd4-fced-11ec-ba43-dac502259ad0.png

语义角色抽取和目前我实验所采用的范式一样,都是层叠指针结构。另外因为不同类型事件有各自的论元角色,如果全部建模到模型中,模型会变得很复杂,所以百度将所有角色分门别类,如主体、客体等等(这里百度称为语义角色),然后利用多层指针结构同时抽取。

9470645e-fced-11ec-ba43-dac502259ad0.png

需要指出的是,通用属性抽取的问题是无法灵活地泛化。MRC(阅读理解方案)的问题则是效率,因为需要对每一个角色都进行单独提问抽取。

2.3 科大讯飞

无,但科大讯飞有举办相关比赛,这里有一份参赛者的分享科大讯飞2020完整事件抽取系统[6]。

范式

非标准的事件抽取,任务包括:抽取触发词,主体/客体/时间/地点,判定事件发生状态的属性,包括极性、时态。极性分为:肯定、否定、可能;时态分为:过去、现在、将来、其他。

技术栈(pipeline)

触发词抽取:Bert+指针结构;特征层面:利用远程监督增加了已知的所有触发词的嵌入。

948fb5e8-fced-11ec-ba43-dac502259ad0.png

主体/客体/时间/地点抽取:Bert+conditionalLayerNorma+指针结构。特征层面:trigger在文本中的位置、其他词到trigger的位置。

94bc173c-fced-11ec-ba43-dac502259ad0.png

2.4 深擎科技

在他们主页上没有找到相关接口,但是找到一篇他们分享的文章结合指针网络的注意力机制(PAN模型)实现金融领域事件抽取[7]。这篇文章里主要提及了事件主体识别和事件类型判定:

事件类型判定:

金融事件的特征相对明显,业务术语等很大程度上决定了分类的效果,他们直接采用Fasttext分类模型,在句子级的事件识别任务中达到了95.7%的准确率。

事件主体识别:

采用了基于指针网络带注意力机制(PAN,Point Attention Network:Bert+BiLSTM+Self-Attention+Pointer Network)的事件主体识别模型,从文本中找出在事件中充当的主体角色元素。

2.5 幂律智能

94e02780-fced-11ec-ba43-dac502259ad0.png

幂律智能-功能介绍

领域范畴

法律方向,分析对象主要为裁判文书、案件卷宗等法律描述文本

范式(非标准事件抽取)

主要抽取出独立的包含时间、人物、地点、描述的子事件

技术栈

基于深度学习的序列标注模型,从探测出的事件片段中预测出时间、地点、任务、描述信息

值得注意的是,他们还有一个时间线(类似于事件脉络),主要是通过提取出的时间标准化比对。

94fd655c-fced-11ec-ba43-dac502259ad0.png

幂律智能事件抽取展示页面

2.6 云孚语义

有,而且已经有了事件脉络(原计划将要做的,别人已经有了),但是目前没有看到云孚主页[7]有演示接口,仅看到它的微信公众号文章中的展示。

9514e4d4-fced-11ec-ba43-dac502259ad0.png

云孚语义-事件脉络

3.总结

关于事件抽取方向的相关厂商调研内容就到这里了,后续将会出事件抽取方向调研-技术栈篇等相关内容。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 事件
    +关注

    关注

    0

    文章

    12

    浏览量

    10159
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11255

原文标题:3.总结

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国家数据局领导莅临中汽中心调研指导

    2025年11月20日,国家数据局局长刘烈宏一行到中汽中心调研指导工作,天津市副市长翟立新陪同调研,中汽中心党委委员、副总经理周华参加调研活动。
    的头像 发表于 11-25 10:04 250次阅读

    广东省人大常委会主任黄楚平率队调研亿纬锂能

    近日,广东省人大常委会主任黄楚平率调研组到亿纬锂能开展调研,惠州市委书记刘吉等领导陪同。期间,调研组实地察看企业生产经营情况,听取前沿技术创新成果汇报,详细了解人大助力企业发展各项举措落实进展,并与亿纬锂能董事长刘金成博士深入交
    的头像 发表于 10-28 09:37 388次阅读

    产品经理的AI产品调研助手,墨刀AI Agent洞察更精准

    在产品设计领域,深度调研是设计的起点。在产品经理的工作流程中,调研分析不仅是项目的“先锋”,更在 很大程度上决定产品的最终命运 。扎实的调研能为产品指明方向、识别风险、找到增长机会;而
    的头像 发表于 10-23 12:00 189次阅读
    产品经理的AI产品<b class='flag-5'>调研</b>助手,墨刀AI Agent洞察更精准

    请问bsp文件夹中各芯片厂商的外设drv文件都是由芯片厂商自己开发的吗?

    添加一个新的芯片厂商到bsp文件夹中(rt-thread-v4.1.0bspxx32), xx32目录下的drv文件需要厂商自己开发上传吗? 搜了下相关资料,有部分说法是社区开发者根据厂商
    发表于 09-25 06:00

    中国联通一行莅临震有科技调研交流

    网安等重点方向进行了深入探讨。这次调研为双方在前沿技术和应用场景上的合作提供了宝贵契机,是一次富有价值的交流。
    的头像 发表于 09-12 15:43 1095次阅读

    国产前20家MEMS惯性传感器厂商汇总,火丰精密入选榜单

    国产前20家MEMS惯性传感器厂商汇总,火丰精密入选榜单惯性传感器作为能够检测被测物体惯性力,进而测量其加速度、角速度及相应运动状态变化的关键部件,广泛应用于从消费电子到航空航天等诸多领域。无论是智能手机的屏幕旋转,还是火箭、飞机的导航,都离不开惯性传感器的精准感知。
    的头像 发表于 08-26 17:05 2064次阅读
    国产前20家MEMS惯性传感器<b class='flag-5'>厂商</b><b class='flag-5'>汇总</b>,火丰精密入选榜单

    山东省领导莅临海辰储能菏泽基地调研指导

    近日,山东省委书记林武莅临海辰储能山东一体化零碳储能产业园(菏泽基地)调研指导。海辰储能联合创始人、总裁,山东海辰储能法定代表人、董事长王鹏程;山东海辰储能总经理张庆云陪同调研并汇报相关工作。
    的头像 发表于 08-12 15:30 1226次阅读

    【重要通知】OpenHarmony主干平台开发板选型提报倒计时(参考工具发布)

    芯片平台: RK3588、展锐7885、飞腾D3000M、海思(型号待定)各厂商/团队如有以上芯片平台的开发板,请将相关资料(开发板产品信息、详细产品规格书、初步报价方案等)于本周六(7月26日)20
    发表于 07-24 09:17

    湖州市领导莅临润芯微子公司华俊科技调研

    近日,湖州市委常委、常务副市长王宗明率队调研润芯微科技全资子公司华俊科技,湖州南浔经开区等相关领导陪同。
    的头像 发表于 06-13 16:16 663次阅读

    工信部电子信息司领导莅临行芯科技调研

    近日,工业和信息化部电子信息司王世江副司长一行到行芯科技进行专题调研,省市区经信部门相关负责人随行陪同。
    的头像 发表于 06-11 10:38 1250次阅读

    ICY DOCK PCIe可拆卸式扩展插槽硬盘抽取盒或转接器,革新存储解决方案

    插槽硬盘抽取盒或转接器站在创新的最前沿。我们的解决方案重新定义了易用性,提供快速、免工具的硬盘抽取盒安装和无缝的硬盘更换。它们非常适合存储敏捷性,专为快速维护和轻
    的头像 发表于 04-18 14:42 692次阅读
    ICY DOCK PCIe可拆卸式扩展插槽硬盘<b class='flag-5'>抽取</b>盒或转接器,革新存储解决方案

    国家数据局领导莅临华工科技调研

    日前,国家数据局党组成员、副局长沈竹林一行前往华工科技产业股份有限公司(以下简称“华工科技”),围绕数据要素相关工作进行调研。湖北省数据局党组书记、局长周森锋,华工科技副总裁熊文、华工赛百董事长杨肖等陪同调研
    的头像 发表于 03-03 14:42 821次阅读

    最新!智慧灯杆八大应用场景案例独家汇总

    最新!智慧灯杆八大应用场景案例独家汇总
    的头像 发表于 01-14 12:47 1170次阅读
    最新!智慧灯杆八大应用场景案例独家<b class='flag-5'>汇总</b>

    6家企业成立机器人相关公司

    在2024年8月,高工机器人汇总了5家企业出资设立机器人相关子公司,分别是江苏雷利、倍轻松、禾川科技、豪森智能、奇瑞汽车等。
    的头像 发表于 01-10 10:25 1457次阅读

    请问AMC1203文档中的OSC过采样率和sinc3滤波器中的抽取率是不是同一个概念?

    1、请问AMC1203文档中的OSC过采样率和sinc3滤波器中的抽取率是不是同一个概念?同为256? 2、抽取率是不是MCLK时钟的分频因子? 3、Combining the ADS1202
    发表于 12-16 06:42