0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

王昊奋:《智能问答在企业计算中的机遇与挑战》的精彩演讲

MqC7_CAAI_1981 来源:lq 2018-12-14 15:46 次阅读

由中国人工智能学会主办,广州易间网络科技有限公司承办的2018第八届中国智能产业高峰论坛11 月17-18日在成都完美收官,论坛在两天的会议里带来了多场精彩报告。

此次小编为大家整理的是来自上海乐言信息科技有限公司CTO王昊奋主题为《智能问答在企业计算中的机遇与挑战》的精彩演讲。

王昊奋

上海乐言信息科技有限公司CTO

以下内容根据速记进行整理

经过王昊奋本人校对

企业计算是一个新名词,它有四项优势:第一,降低成本;第二,提高效率;第三,增加营收;第四,保障安全。

从典型的应用来说,首先是市场,企业计算在市场方面能增加潜在营收。市场比较关心的,一方面是受众和渠道的获取,即在客户留存和增加黏度这些方面如何提升;另一方面是内容的优化,即如何刺激大家冲动消费,真正提升客单价。常见的如信息流中的头条或者短视频网站,它们会结合用户本身足迹的数据,推荐一些热门的或者用户感兴趣的内容,这就是“猜你想”消费。

另一个应用是客户服务,传统方式的人工客服是一个劳动密集型+知识密集型的工作,人工客服流动性非常大,客户满意度不高。举个例子,“双十一”大家会问各种各样的问题,其中很大一部分是机械重复的,还有很多没有经过充分培训很难给出准确解答。现在出现了越来越多的在线客服平台,包括钉钉、旺旺、微信小程序等,传统服务模式受到冲击,新型服务向自助或者在线式转型,企业计算在客服领域能降低成本、提高效率。

再就是风险管控方面的应用,主要包括风险回避和损失控制等;也涉及一些反欺诈的识别,比如信用评级和评估,如芝麻信用就是作为互联网的指针,衡量用户信用情况的应用。

企业计算应用广泛,市场潜力巨大。对比中国2B市场和美国2B市场:占比方面,美国2B公司密度和营收情况接近40%,而中国仅有10%;公司方面,2C巨头美国有FAANG,中国有BAT,2B巨头美国有估值和市值百亿美金以上的IBM、MICROSOFT,但中国没有。2B是一个巨大的市场,这其中既有很大的机遇,也面临不小的挑战。

我们觉得有很多事情可以去做,搭建了一套智能咨询服务平台。我们不把它称之为问答平台,问答是偏技术的说法,业务人员不懂什么叫问答,我们叫做智能咨询平台,咨询是服务层面的。这个平台面向外部用户和内部用户,是一个2B结合2C的模式。通过赋能B端用户,提高C端服务质量。

面向外部用户,比如这个东西卖给谁?目标用户是谁?面向内部用户,比如,销售人员需要关心市场动态和发展趋势,业务人员需要知识采编审阅用于内部培训和交流,运营人员需要收集反馈和优化操作,我们都可以提供相应的辅助。为了实现这样的2B结合2C的模式,需要建立相应的知识库,主要从用户端、行业理解、企业内部业务系统三个方面对接输入,而后进行知识的获取,以及动态的跟踪和监控,这个过程中内部数据和外部数据要综合使用。

我们把这个平台的技术概括成两个引擎,第一,知识学习引擎;第二,语义理解的引擎。这其中人机协同也非常重要,2B行业的准确率要求接近100%,纯靠机器是做不到的,需要让人能更有效地参与,更好地贡献知识。阿里提出AI训练师,他与我们普通意义上的标注人员又有什么区别?这需要好好思考。

我们在企业计算的切入点是智能咨询,希望做的本质的东西是智能问答。智能问答有很多范式,2011、2012年出现了很多开元的知识库和吸引眼球的尝试,现阶段任何一项技术,都有其天花板及适用性,在一个技术不能打遍全场的情况下,需要有多引擎的问答,下面会具体讲解IRQA、KBQA和MRCQA的问题。我们会有三种类型数据,第一,文本数据,包括很多政策、法规的数据;第二,问答对数据,这类数据是相对容易获取的;第三,知识图谱数据,这类数据比较结构化。

问题生成本身非常零散,不是通过问答文本表述出来的,可以通过一定方式去生成所对应的问题,因为它的答案相对固定。另外,在真正使用智能问答时,需要综合考虑数据来源、数据规模和构建成本等方面。

从技术形态来看,基于知识图谱的问答就是KBQA,其中既包括传统的静态知识图谱,也包括各种各样事理图谱,剩下就是IRQA的内容,FAQ的部分是包含在IRQA里的。还有一些文本更适合MRC即机器阅读理解的方式。我们希望做到精确回答垂直领域的问题,但是这需要在本身的准确率、覆盖率,以及用户体验等很多方面做综合考虑,所以数据的来源,或者知识本身的形态会多种多样。我们希望更加友好的、直观可以判断的技术能够更好嵌入,来满足多引擎的需求。

以基金行业为例。IRQA的来源主要是业务人员积累的FAQ。例如,“申购基金什么时候确认呢”,这个的标准问答是“基金申购何时能够确认”。KBQA,比如“你们公司有几种货币型基金”,需要对用户的查询进行语义解析,并在知识图谱中查询推理得到答案。MRC,比如“开放式基金价格由什么因素决定”。我们做的MRC与现在流行的阅读理解比赛相比的区别是需要更往前一步,首先要知道用户的问题对应的是哪个或哪些文件;然后再进行文档检索、段落检索;最后是阅读匹配。

各种问答形态和技术不是孤立的,多引擎的问答会进行融合。IRQA擅长高频问题,数据要求是FAQ数据中存在和用户问题配对的FAQ,它的答案是静态存储的。KBQA需要非常正确的解析用户本身的问题,需要知识库里包含这些知识点。这些知识点不能是孤立的,需要有相应关联。MRC和IRQA的区别不是很大,它的好处在于减少了结构化的成本,而且生成的答案是动态的、粒度更加精细。

问答引擎是针对一问一答,要最终实现多轮对话,还需要相应的对话引擎。对话引擎主要涉及对话策略跟踪、对话策略学习等方面。IRQA会分成在线部分和离线部分。在线部分会转换多阶段的问题,第一阶段会使用搜索引擎做检索,而后是精排和筛查。很多时候仅仅得到一个排名结果是不够的,所以我们额外增加了一个部分筛查。离线部分需要对FAQ数据建立粗排索引,通过挖掘领域词和句式,运用生成方式,结合人工标注,如加噪等方式建立精排和筛查模型。第一步粗排模型非常重要,略过粗排这个步骤直接进行精排,结果往往不尽如人意。我们希望在更小的侯选空间里进行建模,这可以有很多的手段。一种手段可以是完全利用深度学习的方法去做,但现在更多是用一些整合的方式。基于IRQA有几种不同的模型,一种是面向表示的建模,这种端到端的建模比较简单,它的问题主要在于对数据的要求比较高,不适合冷启动,可解释性和可干预性也比较差。我们的创新在于从可解释的角度做特征工程,知识特征包括领域词之间上下位关系,还有对应的句式的内容,同时也会有通用领域训练、关系的迁移刻画等。

KBQA也是分成在线部分和离线部分。在线部分主要是问题的理解,问题理解之后有语义解析和执行回复生成。语义解析可以基于模板,通过语义理解可以转换成所对应的一些标注内容,将数据库存储的信息做转化和加固。除了人工撰写模板,也可以通过机器学习生成模板,然后人工进行审核。我们需要设计规则来生成标准问法,这是拓扑结构上的问题。问题匹配不到,或者匹配到的回答过于抽象,结果都是不能执行,都会影响召回率。乱回答会产生很多噪声,机器基于侯选级去做相应的计算,在这个过程中会用到单指令多数据的并行优化。

MRC比较简单。MRC是IRQA在最后一步精排和筛查里用了阅读理解模型,前面很多步骤和IRQA一样,只是具体匹配到的内容存在差别。本身文档或者段落的匹配,更像传统IR的任务,后面比较复杂的精细化模型都是通过表示层、输出层来做。MRC可以在反馈前对答案进行一定精简,给用户一个更智能更友好的体验。

前面提到了很多次语义解析,语言理解包括实体识别和链接、答案类型判断等,这里一个是意图理解问题,一个是双向序列标注问题。回复生成也会考虑很多内容,它是生成和回答相结合的内容。多轮对话的模式设计中,需要重视多用户管理和分发的问题。

具体的工程实践主要是四块,第一是数据收集;第二是模型更新;第三是上线发布;第四是反馈收集。数据获取通过技术层的领域词挖掘、数据标注和审核,针对不同类型的数据服务有不同的任务。模型更新包括领域的适配、索引的更新,以及数据的优化。智能导航包括热点问题推荐,另外还有一些相关实体问题推荐。反馈收集包括平台训练模型更新、日志更新等问题。另外还会有交互设计,其中导航的点击,以及对答案的采纳程度等都需要关注。在此之外,我们还会去做请求负载均衡、数据存取分流、服务质量控制等这些任务。

做智能问答,最希望做到拟人;第二是智能;第三是精准,希望精准度达到99%以上。我们的成效在于帮助企业节约人力,改善结果,提高转化率。目前在电商客服领域,每天服务300~400万人次,2018年“双十一”当天服务了2 366万人,创造了新的高度。我们希望“引领认知智能,跃升人类知识工作”不仅是一句口号,而是真正地去赋能企业,提升全人类。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    10892

    浏览量

    100674
  • 知识图谱
    +关注

    关注

    2

    文章

    131

    浏览量

    7593

原文标题:CIIS2018演讲实录丨王昊奋:智能问答在企业计算中的机遇与挑战

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA 知乎精彩问答甄选 | 探索 AI 如何推动工作流升级相关精彩问答

    NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。 本期为问答甄选第十九期 —— 探索 AI 如何
    的头像 发表于 12-14 16:10 158次阅读
    NVIDIA 知乎<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>甄选 | 探索 AI 如何推动工作流升级相关<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>

    NVIDIA 知乎精彩问答甄选 | 查看关于 NVIDIA Omniverse 的相关精彩问答

    知乎甄选问答将为您分享  NVIDIA Omniverse 的相关精彩问答 Q: NVIDIA 全新的 Omniverse Cloud API 有何亮点? A: NVIDIA 将为开发者和企业
    的头像 发表于 12-01 18:40 217次阅读
    NVIDIA 知乎<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>甄选 | 查看关于 NVIDIA Omniverse 的相关<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>

    NVIDIA 知乎精彩问答甄选 | 分享 NVIDIA 助力医学研究的相关精彩问答

    NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。 本期为问答甄选第十七期 ——  分享 NVID
    的头像 发表于 11-24 19:25 259次阅读
    NVIDIA 知乎<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>甄选 | 分享 NVIDIA 助力医学研究的相关<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>

    精彩回顾| “NVIDIA AI 研发技术开放日” 演讲视频全集!

    技术开放日 上,共邀请了 10 位来自 NVIDIA 加速计算专家团队的讲师,深入互联网核心应用场景,聚焦五大技术热点,与大家分享了加速计算的优化经验。 演讲视频已正式上线 欢迎扫描下方二维码,观看
    的头像 发表于 11-09 10:45 197次阅读
    <b class='flag-5'>精彩</b>回顾| “NVIDIA AI 研发技术开放日” <b class='flag-5'>演讲</b>视频全集!

    精彩回顾 | “NVIDIA AI 研发技术开放日” 演讲视频全集!

    技术开放日 上,共邀请了 10 位来自 NVIDIA 加速计算专家团队的讲师,深入互联网核心应用场景,聚焦五大技术热点,与大家分享了加速计算的优化经验。 演讲视频已正式上线 欢迎扫描下方二维码,观看
    的头像 发表于 11-09 10:45 178次阅读
    <b class='flag-5'>精彩</b>回顾 | “NVIDIA AI 研发技术开放日” <b class='flag-5'>演讲</b>视频全集!

    NVIDIA 知乎精彩问答甄选 | 分享 NVIDIA 在艺术创作方面的精彩问答

    NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。 本期为问答甄选第十五期 ——  分享 NVID
    的头像 发表于 10-13 20:30 272次阅读

    英码科技精彩亮相火爆的IOTE 2023,多面赋能AIoT产业发展!

    令现场的伙伴们叹服,激起了大家浓厚的兴趣。 发表主题演讲,共襄AIoT产业新机遇 同期举办的AIoT视觉物联产业生态大会上,英码科技市场总监李甘来先生受邀发表了 《释放边缘智能潜力,
    发表于 09-25 10:03

    OpenHarmony应用核心技术理念与需求机遇简析

    小程序等上的组织、企业、商户等;OpenHarmony既是一次机遇、同时又是一次大的挑战,只有拥抱时代和变化,才会在这轮升级胜出。 比如互联网时代联接的是电脑,我们访问的都是各种WE
    发表于 09-22 16:12

    NVIDIA 知乎精彩问答甄选 | 了解更多关于 NVIDIA BlueField DPU 相关精彩问答

    知乎甄选问答将为您了解 NVIDIA BlueField DPU 相关内容带来更加精彩的解答! Q:  下一个半导体黄金赛道 DPU 的生态会如何建设? A: 随着人工智能、数据科学、虚拟仿真等数据流
    的头像 发表于 09-20 19:10 222次阅读

    NVIDIA 知乎精彩问答甄选 | 查看 NVIDIA Jetson 相关精彩问答

    NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。 本期为问答甄选第十二期 ——  查看 NVID
    的头像 发表于 09-14 17:40 311次阅读

    NVIDIA 知乎精彩问答甄选 | 发掘 NVIDIA 医疗行业相关精彩问答

    NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。 本期为问答甄选第十一期 ——  发掘 NVID
    的头像 发表于 09-06 19:15 329次阅读
    NVIDIA 知乎<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>甄选 | 发掘 NVIDIA 医疗行业相关<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>

    NVIDIA 知乎精彩问答甄选 | 查看 NVIDIA Omniverse 相关精彩问答

    NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。 本期为问答甄选第十期 ——  查看 NVIDI
    的头像 发表于 08-01 19:55 332次阅读
    NVIDIA 知乎<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>甄选 | 查看 NVIDIA Omniverse 相关<b class='flag-5'>精彩</b><b class='flag-5'>问答</b>

    智能网卡简介及其高性能计算的作用

    的功能。用于 AI 的基于 FPGA 的智能网卡的操作深度神经网络的监督训练涉及几个步骤。第一步(称为前向传递),DNN 预测小批量输入的输出,并计算与真实标签相比的误差。接下来,
    发表于 07-28 10:10

    问答对话文本数据:解锁智能问答的未来

    在日常生活中,我们经常面临各种问题和需求,而智能问答系统作为一种人机交互工具,为我们提供了便捷的问题解答和信息获取方式。而问答对话文本数据作为推动智能
    的头像 发表于 07-13 14:19 306次阅读

    储能行业广泛使用金德大电流电感

    )——传输电(电网公司)——使用电(用户)三个环节都可以树立储能。电感器作为储能产品的根底元件,涉及电压和电流转换的装置均需用到,使用范畴十分广泛。那么,储能产品给电感企业带来了哪些商场机会?储能行
    发表于 06-20 16:31