0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深兰科技在新冠百科知识图谱类型推断等三个任务中夺得第一

ss 来源:粤讯 作者:粤讯 2020-11-17 15:08 次阅读

11月12~15日,国内知识图谱和语义计算等领域的核心学术会议CCKS2020,在江西南昌成功举行,深兰科技DeepBlueAI团队首次参加即斩获三冠一亚,成为本届会议唯一获得多个冠军的队伍。团队分别在“新冠百科知识图谱类型推断”、“面向金融领域的篇章级事件主体抽取”、“基于标题的大规模商品实体检索”这三个(子)任务中夺得第一,在“面向中文短文本的实体链指”任务中仅以0.00002分之差屈居第二。此外,本届组委会还特别评选出每一任务至多一项的“创新技术奖”,专门用于鼓励创新性技术的使用,深兰科技在“基于标题的大规模商品实体检索”的任务中再次脱颖而出。

第十四届全国知识图谱与语义计算大会(CCKS:China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专业委员会主办,主题是“知识图谱与认知智能”,共设立8个相关主题的技术评测任务,旨在为研究人员提供测试知识图谱与语义计算技术、算法及系统的平台和资源,促进国内知识图谱领域的技术发展,此次吸引了包括华为、百度、腾讯、小米、北京大学、上海交通大学、浙江大学等知名企业和学府的团队同台竞技。

随着互联网技术的飞速发展,人们逐渐从信息时代进入智能时代。知识图谱作为承载底层海量知识并支持上层智能应用的重要载体,在智能时代中扮演了极其重要的角色。尤其多模态知识图谱的构建,能够让基于知识图谱的智能服务更好地理解真实世界的数据场景,进而更好地支撑各项上游任务和行业应用,如推荐系统、语义搜索、智能问答等。深兰科技夺冠的三个任务方案,分别可在电商、金融、舆情监控等领域的应用上发挥重要作用。

“新冠百科知识图谱类型推断”任务,要求从实体百科(包括百度百科、互动百科、维基百科、医学百科)页面出发,从给定的数据中推断相关实体的类型。然而,大量类型信息以非结构化文本形式呈现于网络页面中,文本处理难度大,抽取结果同时保证高准确度和覆盖率仍然是个极大的挑战。针对数据集的特点,DeepBlueAI团队构建了数个基于BERT模型的文本分类器,并引入了多个外部数据集,最后将这些分类器进行融合得到最终判断结果。实体类型是知识图谱的重要组成,正确的实体类型是构建一个高质量知识图谱的前提。

“事件”在金融领域是投资分析、资产管理的重要决策参考,也是知识图谱的重要组成部分,而“事件抽取”是进行图谱推理、事件分析的必要过程。在金融领域,“事件抽取”是一项十分重要的任务,也是自然语言处理领域一项比较复杂的任务,它的挑战相当部分体现在文本复杂上:输入的文本可能是句子、段落或者篇章,不定长度的文本使得限制文本长度的模型无法使用。“面向金融领域的篇章级事件主体抽取”任务中,团队使用了多标签事件分类加实体识别Pipeline模型,在标准的多标签分类模型中加入了特征提取模块,实体识别模型采用BERT-LSTM-CRF与阅读理解投票融合的方式,最终以较大优势获得第一。

“基于标题的大规模商品实体检索”是典型的语义识别类任务,在网购已经成为一种生活方式的前提下,具有非常实用的价值。商品标题一般较短,上下文语境不丰富;用户搜索时,文本口语化严重;商品标题中存在很多变异指代,没有给定的指代映射表;这都需要对上下文语境进行精准理解,具有很大的挑战。团队针对商品检索任务采用召回-粗排-精排的总体方案,在召回阶段放弃了bm25、dssm等主流召回技术,创新性地使用Triplet BERT模型进行召回,在排序阶段采用基于BERT的二分类排序方式,检索准确率达到0.88489。最终不但排名第一,还收获了创新技术奖。

从包括CCKS2020在内的国内外顶会的赛题任务设置中不难发现,其共同点在于更注重了落地应用性。随着社会的发展,人工智能已逐渐渗透到各个行业并转化为实际应用,而深兰科技早在成立之初就提出了“基础研究与落地应用”齐头并进的理念,并取得了有目共睹的成效。会议竞赛的成绩是对过往的检验,更是对今后不断进取的鞭策,“人工智能服务民生”将是深兰科技矢志不渝的目标。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算
    +关注

    关注

    2

    文章

    431

    浏览量

    38477
  • 语义
    +关注

    关注

    0

    文章

    21

    浏览量

    8630
  • 知识图谱
    +关注

    关注

    2

    文章

    131

    浏览量

    7593
收藏 人收藏

    评论

    相关推荐

    深兰科技再次入围《2024胡润全球独角兽榜》

    4月9日,胡润研究院于广州发布了《2024全球独角兽榜》,榜单列出了全球成立于2000年之后,企业估值价值在10亿美元以上的非上市公司。深兰科技继2023年之后,再次入围该榜单。
    的头像 发表于 04-11 09:17 165次阅读
    <b class='flag-5'>深兰科</b>技再次入围《2024胡润全球独角兽榜》

    利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统(下)

    对于语言模型(LLM)幻觉,知识图谱被证明优于向量数据库。知识图谱提供更准确、多样化、有趣、逻辑和一致的信息,减少了LLM中出现幻觉的可能性。
    的头像 发表于 02-22 14:13 271次阅读
    利用<b class='flag-5'>知识图谱</b>与Llama-Index技术构建大模型驱动的RAG系统(下)

    知识图谱基础知识应用和学术前沿趋势

    知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系。是融合了认知计算、知识表示与推理、信息检索与抽取、自然语言处理、Web技术、机器学习与大数据挖掘等等方向的交叉学科。人工智能是以传统符号派与目前流行的深度神经网路为主,如下图所示,
    的头像 发表于 01-08 10:57 435次阅读
    <b class='flag-5'>知识图谱</b>基础<b class='flag-5'>知识</b>应用和学术前沿趋势

    深兰科技入选“2023数字经济独角兽排行榜”

    12月19日-20日,“2023数字经济独角兽大会”在北京大兴经济开发区隆重举行。会上,还正式发布了“2023数字经济独角兽排行榜”,深兰科技成功入选。
    的头像 发表于 12-22 10:36 301次阅读

    深兰科技连续第4年通过SGS的4体系审核

    近日,国际权威第三方认证机构SGS,对深兰科技进行了“ISO 27001信息安全管理体系”的换证审核,经过SGS派遣的外审员为期数天的严格审核,深兰科技成功过审。 SGS对信息安全管理体系的审核
    的头像 发表于 12-14 09:28 390次阅读

    深兰科技再次通过ISO9001质量管理体系等ISO三体系认证

    近日,国际权威第三方认证机构SGS对深兰科技展开了年度ISO三体系认证。经过SGS派遣的4位外审员为期3天的严格审核,深兰科技通过了今年的ISO三体系换证审核。 这已经是深兰科技第2次以零严重轻微
    的头像 发表于 11-08 10:00 316次阅读
    <b class='flag-5'>深兰科</b>技再次通过ISO9001质量管理体系等ISO三体系认证

    知识图谱与大模型结合方法概述

    ;3)LLM+KG协同使用,主要用于知识表示和推理两个方面。该文综述了以上三个路线的代表性研究,探讨了未来可能的研究方向。 知识图谱(KG)和大语言模型(LLM)都是知识的表示
    的头像 发表于 10-29 15:50 603次阅读
    <b class='flag-5'>知识图谱</b>与大模型结合方法概述

    深兰科技斩获“上海设计100+”和“设享奖EDW”大奖

    国庆前夕,“上海设计100+”和“设享奖EDW”两项产品设计大奖的获奖榜单先后揭晓,深兰科技出品的计算机视觉工业检测标准化设备-剑齿虎在两项大奖的评选中皆获大奖。
    的头像 发表于 10-12 16:03 475次阅读

    深兰科技与西班牙BOMAPA集团签署AI工业解决方案合作协议

    近日,深兰科技集团与西班牙BOMAPA SERVICES SL.集团在深兰科技上海总部大厦正式签署AI工业解决方案合作协议。
    的头像 发表于 09-14 17:50 856次阅读

    云知声亮相第十七届全国知识图谱与语义计算大会

    8月24日-27日,第十七届全国知识图谱与语义计算大会(CCKS 2023)在沈阳成功举办。大会聚焦“知识图谱赋能通用AI”,邀请国内外知名学者、产业界知名发言人员介绍相关领域的最新进展和发展趋势
    的头像 发表于 08-31 16:02 407次阅读
    云知声亮相第十七届全国<b class='flag-5'>知识图谱</b>与语义计算大会

    如何利用大模型构建知识图谱?如何利用大模型操作结构化数据?

    上图是之前,我基于大语言模型构建知识图谱的成品图,主要是将金融相关的股票、人物、涨跌幅之类的基金信息抽取出来。
    的头像 发表于 08-24 16:56 8583次阅读
    如何利用大模型构建<b class='flag-5'>知识图谱</b>?如何利用大模型操作结构化数据?

    大型语言模型与知识图谱:机遇与挑战

    这对知识表示领域来说是一个巨大的步骤。长时间以来,人们关注的是明确的知识,例如嵌入在文本中的知识,有时也被称为非结构化数据,以及以结构化形式存在的知识,例如在数据库和
    的头像 发表于 08-24 14:50 425次阅读
    大型语言模型与<b class='flag-5'>知识图谱</b>:机遇与挑战

    深兰科技用AI守护青年人的心理健康

    8月14日上午,“2023树洞救援年会”在上海举行,会上举行了“心理健康人工智能产学研创新联盟”的签约和揭牌仪式。“树洞行动救援团”创始人深兰科学院智能科学首席科学家、荷兰阿姆斯特丹自由大学
    的头像 发表于 08-16 10:55 971次阅读

    知识图谱嵌入模型 (KGE) 的总结和比较

    知识图谱嵌入(KGE)是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型。它们将“知识”投射到一个连续的低维空间,这些低维空间向量一般只有几百个维度(用来表示知识存储的内存效率)。向量空间中,每个点代表一个概念,每个点在空
    的头像 发表于 07-31 16:07 621次阅读
    <b class='flag-5'>知识图谱</b>嵌入模型 (KGE) 的总结和比较

    巨微文化携手IBM依托AI共塑知识图谱新篇章

    知识图谱是具有 AI 能力加持的智能“知识库”,借助于基于 AI 的自然语言处理 (NLP) 能力,打造智能搜索、智能问答、个性化推荐、辅助决策和异常监测等能力。对于教辅此类知识密集型行业,科目复杂度高,需要多个专家协同工作
    的头像 发表于 06-05 16:17 568次阅读