0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NLP领域的难处

姚小熊27 来源:lw 作者:CV智识 2019-09-10 09:48 次阅读

NLP领域公司大多成立在2015年、2016年左右,正逢AI热潮,入局并不算晚,但目前的融资大多还停留在A轮或者B轮,而同时期的语音、计算机视觉公司们却已经在纷纷冲刺上市。

2019年初,全球创投研究机构CBInsights发布了32家全球AI独角兽公司名单,其中美国有17家,中国有10家,商汤科技、云从、云知声、寒武纪等纷纷上榜。

经过政策、资本的快速助推,计算机视觉领域、语音领域纷纷跑出多个独角兽,而作为“皇冠上的明珠”的NLP领域却难见独角兽的影子。

众多的NLP领域公司大多成立在2015年、2016年左右,正逢AI热潮,入局并不算晚,但目前的融资大多还停留在A轮或者B轮,而语音、计算机视觉公司们已经在纷纷冲刺上市。

8月5日AI语音公司云知声对CV智识证实,正在接受科创板上市辅导;8月25日晚,计算机视觉公司旷视科技向港交所递交IPO招股书。

AI主要包含两个层面,一个是认知智能,一个是感知智能。比如语音识别、计算机视觉属于感知智能的层面,而 NLP 则属于认知智能层面。

为何NLP公司们跑的最慢?当前的落地应用到底发展到了什么程度?CV智识带着这样的疑惑与业内人士聊了聊目前的现状。

缺乏相对独立且足够大的场景

“NLP缺少相对独立且足够大的场景”,深度好奇创始人吕正东告诉CV智识,“它往往会变成一个引擎或者一个特定功能上的服务,这个的确制约了它的市场。”

所谓相对独立且足够大的落地场景,就像安防市场之于整个计算机视觉领域。

据中商产业研究院发布的《2018-2023年中国安防行业市场前景及投资机会研究报告》数据统计显示,我国安防行业市场规模从2012年的3240亿元增长到2017年的5960亿元,年均复合增长率达13%左右。

千亿需求驱动商业发展,技术突破加上场景自然结合,独角兽自然就容易脱颖而出。

反观NLP,众所周知,特别纯粹的应用就是机器翻译,众多行业公司产品也扎堆而生。

2016年底,科大讯飞推出晓译翻译机,直到2019年5月,讯飞翻译机更新至3.0;搜狗的旅行翻译宝在2018年1月正式亮相,9月又推出了搜狗翻译宝Pro;猎豹移动在2018年7月发布了小豹AI翻译棒。

出境旅游的语言沟通的确是很多游客的最大瓶颈,游客对智能翻译机的需求也的确存在,“只是用户的身上已经存在了智能手机、智能手表等不同的智能硬件,对于用户来说,真的愿意仅仅为了满足单一的翻译需求再增加一个硬件吗?”一位NLP领域产品经理对CV智识表示。

为了一个简单的需求,用户需要付出的价格并不便宜:小豹AI翻译棒售价229元,搜狗翻译宝Pro售价2299元,讯飞翻译机3.0售价3499元。

这与用户一直以来习惯的免费在线翻译服务正好相反。

从互联网时代的百度在线翻译、谷歌翻译等产品来看,日常翻译已经成为了一个带有天然的平台性或者免费服务性质的业务。

且根据中商产业研究院发布的《2018-2023年中国翻译机行业市场前景研究报告》预计我国翻译机市场规模将从2016年的396亿增长到2020年的561亿元,远没有安防和身份验证市场那么大。

除了市场本身有待验证之外,有业内人士对CV智识表示,“翻译机是一个强技术驱动的产品,并不是语音和翻译的简单串联,语言具有复杂多意性的特征,很难实现标准化和一致性。”

去年4月10日,腾讯翻译君在实时翻译过程中,不仅没有翻译成很通顺的中文,而且出现了几乎占满了几乎一整页的“for”。

腾讯翻译君在之后承认,包括神经网络机器翻译在内的深度学习算法,目前在原理上还有一定不确定性,在特定的情况下有一定的概率引发翻译偏差。

“语音翻译中的语音本身也有自己的技术,它并不是为了后面的翻译专门准备的,因此它在很多时候有自己的优化目标,但这个优化目标有可能在某些方面和翻译不一致,因此在两者结合过程中也需要技术上的再次突破。”

“想打造好的NLP技术非常难。NLP不是一个单一的学科,里面其实会牵扯到深度学习,认知领域,情感模型等等。而且语言的场景太复杂了,就拿中文来说,同一句话放在不同的场景里会有完全不同的解读。”竹间智能创始人兼CEO简仁贤也对CV智识坦言。

智能助手:如何平衡技术与隐私?

“近年来NLP、语音、视觉有融合发展的趋势”,有业内人士对CV智识表示。

除了纯粹的机器翻译场景之外,NLP与其他AI技术融合落地的智能助手以及智能客服成为了重要的落地场景。

2014年亚马逊Echo首次登场,2016、2017年苹果Homepod、谷歌Home、微软Invoke陆续“进场”,智能助手成为各家智能音箱的最大卖点。

随后国内传统硬件厂商和互联网厂商更是争相入局“圈地”,包括小米、阿里巴巴、联想、京东等,相继推出自己的智能音箱。

奥维云网(AVC)全渠道推总数据显示,2019年上半年,中国智能音箱市场在售机型数达到86个,销量为1556万台。除了智能音箱之外,智能助手也成为智能手机的标配。

小爱同学智能语音助手赋予小米手机多项智能化功能;OPPO在今年最新推出的ColorOS 6上也加入了语音助手Breeno;2016 年 11 月,伴随着华为旗舰机型 Mate 9 的发布,华为智能助手正式推出;vivo也从 X21手机开始,在系统中加入智能助手Jovi。

市场研究公司Strategy Analytics报告显示,到今年年底共有47.7%的智能手机将会搭载AI智能语音助手,到了2023年,全球有超过90%的智能手机将会搭载全新的语音助手。

在这场如火如荼的争夺中,无论是巨头还是创业公司纷纷进入,创业公司大多选择解决方案提供商的方式与巨头合作。但不少业内人士表示,这大概率只会成为巨头的游戏。

“智能助手通常会受到它所搭载的设备和系统制约,硬件和系统商拥有比创业公司更高更多的权限。并且很多巨头已经组建自己的技术团队,它们还拥有海量的数据以及实验场景。”吕正东表示。

“智能助手整个模式和技术都已经已经比较白菜化了,手机上的这种对话其实除了语音之外,其他的东西都很难做出非常深的技术了,就是要靠数据积累起来,落地比较多的场景。”有业内人士表示。更何况,以当前NLP技术发展来看,很难让智能助手真的“智能”。

我们经常会遇到答非所问的“智障”表现,比如,你问“美国总统是谁?”智能助手会说“特朗普”,但当你问它“美国总统是特朗普吗?”它就说“不知道。”

除此之外,智能助手还被人诟病的一个问题在于:隐私。

今年7月,据《卫报》报道,苹果的一名承包商称,为了提升Siri的产品能力,苹果会雇佣外部承包商审听录音,其中包括了Siri在意外被激活时收录的私密对话,例如医疗信息、毒品交易和其它信息。

之后苹果公司发表了一份官方声明称,只有不到1%的Siri响应会被分析以改善服务。

苹果Siri并不是第一个因偷听嫌疑而被“讨伐”的对象。

之前,来自谷歌雇佣的人工监听团队的爆料人向比利时荷兰语国家广播电视台(VRT)提供的1000条对话录音显示,有153条都是在Google Assistant被意外唤醒的情况下录制的。

面对频频发生的隐私泄露事件,用户开始担忧智能设备的隐私问题。据MusicWatch的一项调查显示,约有一半(48%)的受访者表示他们担心与智能音箱相关的隐私问题。物联网的发展,信息的边界被无限扩大,但当隐私问题引起争议时,显然很多厂商并未做好准备。

智能客服:闭环能力大于单点突破

人工客服为主体的阶段,大部分机构采取人海战术提供“7*24小时”的咨询服务,成本高、效率低。

互联网时代,大量搭载标准化功能模板的APP、网页端客服产品也并未解决产品体验问题。

随着深度学习等前沿算法被引入到NLP领域,智能客服逐渐开始替代人工客服。

千亿市场,资本纷纷用钱投票。根据前瞻产业研究院数据,截止2018年5月28日,国内包括智能云客服以及客服机器人在内的公司共计69家,累计融资额35.16亿元。

从类型上来看,有从PaaS云通讯延伸到SaaS客服的公司,比如环信、容联七陌;有互联网巨头旗下的智能客服业务部门,比如网易七鱼、腾讯企点;也有单纯的云客服公司,比如Udesk、快商通;也有客服机器人公司,比如云问、追一科技等。

智能客服的客户多为传统行业,业务相对复杂,在NLP技术开始从服务场景、交互方式等重构客服市场时,也不得不面对究竟是以项目制还是标准化软件产品为主的选择。

前者客户接受度高,但需要占用大量人力成本而且难以规模化复制,后者人力成本低可实现规模化复制。

追一科技创始人兼CEO吴悦对CV智识表示,项目制源于两个方面:

一层是商业模式因素,目前传统行业的大公司基本还是希望项目制结算,这个是现状,但长期看,订阅的模式也会逐渐增加。

另外一层是产品化能力不足的原因,中国的企业软件的基础比较薄弱。

过去20年,IT行业的资源都投入到了互联网行业,直到最近几年,资本和人力才逐步投入到企业软件领域。

他表示,企业软件产品化能力和人才沉淀还需要一点时间,当AI产品化程度足够高的时候,项目制形式的规模化和毛利也不会是问题。追一科技现在既做深度定制,也做标准化产品输出,通过银行、保险、券商、能源、地产、汽车的头部客户合作,形成标杆效应,不断积累经验、数据,逐渐打磨出标准化产品。

晓多AI客服创始人江岭曾在接受小饭桌采访时表示,更偏爱SaaS模式,“做传统大企业客户本地化部署项目周期太长,成本比较高,业务增长也比较缓慢,更重要的是得不到数据反馈来形成闭环,因此我们没有选择这个方向。”简仁贤也表示,“定制化虽然是需求上的变革,但在制作层面平台化肯定不可避免。”

在这样的思路下,竹间研发了Bot Factory?平台,能够让客户们可以自己快速根据场景去做定制化。

与消费互联网不同的是,智能客服市场是一个长跑赛道,“如果你希望比别人跑得快的话,那首先是数据的积累,不管是死数据还是活数据的积累,模型其实很多时候是拿数据堆起来的;第二是模式要跟上,包括怎么把智能客服产品去交给客户,需要怎么去维护等。”吕正东表示。

One more thing

无论是智能助手还是智能客服,在交互的过程中,总会发现除了任务问答之外,还会有闲聊功能。

拆解机器人的技术,你会发现,当你一个问题或一句话过去,它会做一个分发,很多时候它会分发到闲聊这个模块上,启动闲聊功能。”

竹间智能高级AI研究员赵景彦曾分享过一个数据:机器人上线了以后大概是60%在做闲聊,40%在做一些正规的业务问答。有些公司就将这部分的闲聊功能拆解出来单独做成一个产品,比如微软推出的小冰。

小冰是一个基于EQ的对话机器人,诞生于2014年,由微软(亚洲)互联网工程院打造。8月15日,微软刚刚发布了第七代小冰。

但开放域聊天技术本身要比任务驱动的技术更为复杂,“目前整体的NLP技术就像深度学习出来之前的计算机视觉技术所处的阶段”,吕正东对CV智识表示。

在当前众多智能助手尚且显得“智障”的现实下,闲聊的效果可想而知。

还有业内人士表示,“这并不是一个刚需产品,意义不大。”对于当前的NLP应用来说,缺乏相对独立且足够大的场景加上技术相对后发是硬伤,但正因为NLP领域尚待突破,寒武纪副总裁刘道福曾表示,这个领域复制之前平台创业的方式,即从学术到商业的路线的可能性仍在。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 独角兽
    +关注

    关注

    0

    文章

    166

    浏览量

    26415
  • nlp
    nlp
    +关注

    关注

    1

    文章

    463

    浏览量

    21823
收藏 人收藏

    评论

    相关推荐

    张宏江深度解析:大模型技术发展的八大观察点

    在大模型的发展史上,Scaling Law(规模律)发挥了核心作用,它是推动模型性能持续提升的主要动力。Scaling Law揭示了这样一个现象:较小的语言模型只能解决自然语言处理(NLP)中的部分问题,但随着模型规模扩大——参数数量增加至数十亿甚至数百亿,曾经在NLP
    发表于 03-14 10:41 82次阅读
    张宏江深度解析:大模型技术发展的八大观察点

    OpenAI推出Sora:AI领域的革命性突破

    大模型的核心技术是自然语言处理(NLP)和深度学习。具体而言,它基于Transformer架构,使用了大规模无监督学习方法,例如自回归语言建模和掩码语言建模,来训练一个庞大的神经网络模型。
    发表于 02-21 16:36 771次阅读
    OpenAI推出Sora:AI<b class='flag-5'>领域</b>的革命性突破

    月之暗面新一轮融资超10亿美元,成为国内AI大模型领域佼佼者

    据了解,月之暗面创立于2023年3月,凭借一支高素质的核心技术团队,迅速崛起并成为该领域的佼佼者。团队囊括Google Gemini、Google Bard、盘古NLP和悟道等大模型项目的研发精英,累计经验超过10年。截止当前,公司员工总数突破80人。
    的头像 发表于 02-21 09:59 1559次阅读

    高分工作!Uni3D:3D基础大模型,刷新多个SOTA!

    我们主要探索了3D视觉中scale up模型参数量和统一模型架构的可能性。在NLP / 2D vision领域,scale up大模型(GPT-4,SAM,EVA等)已经取得了很impressive
    的头像 发表于 01-30 15:56 333次阅读
    高分工作!Uni3D:3D基础大模型,刷新多个SOTA!

    Transformers的功能概述

    近年来,我们听说了很多关于Transformers的事情,并且在过去的几年里,它们已经在NLP领域取得了巨大成功。Transformers是一种使用注意力机制(Attention)显著改进深度学习
    的头像 发表于 01-23 10:15 226次阅读
    Transformers的功能概述

    教您如何精调出自己的领域大模型

    BERT和 GPT-3 等语言模型针对语言任务进行了预训练。微调使它们适应特定领域,如营销、医疗保健、金融。在本指南中,您将了解 LLM 架构、微调过程以及如何为 NLP 任务微调自己的预训练模型。
    的头像 发表于 01-19 10:25 430次阅读
    教您如何精调出自己的<b class='flag-5'>领域</b>大模型

    NLP领域的语言偏置问题分析

    摘要进行全面的统计分析,发现不同语言背景的作者在写作中的词汇、形态、句法和连贯性方面有明显的差异,这表明NLP领域存在语言偏置的可能性。因此,我们提出了一系列建议,以帮助学术期刊和会议的出版社改进他们对论文作者的指南和资源,以增强学术研究的包容性和公平性。
    的头像 发表于 01-03 11:00 241次阅读
    <b class='flag-5'>NLP</b><b class='flag-5'>领域</b>的语言偏置问题分析

    碳化硅的优势和难处

     碳化硅(SiC)具有更低的阻抗和更宽的禁带宽度,使其能够承受更大的电流和电压,同时实现更小尺寸的产品设计和更高的效率。
    发表于 12-11 11:48 529次阅读
    碳化硅的优势和<b class='flag-5'>难处</b>

    人工智能nlp是什么方向

    人工智能nlp是什么方向  人工智能(AI)已经日益普及,正在改变我们的方法和方式。AI 涵盖了许多领域,其中包括机器学习,计算机视觉,自然语言处理(NLP)等。在这些方向之中,NLP
    的头像 发表于 08-22 16:45 1315次阅读

    人工智能包含哪些领域

    自然语言处理(NLP)是AI的另一个重要领域NLP主要研究如何构建计算机程序,使其能够理解、解释、生成和处理人类自然语言。自然语言处理技术可以帮助计算机理解人类的语言、意图和文化。NLP
    的头像 发表于 08-14 14:08 1609次阅读

    Arm的领域管理扩展(RME)介绍

    本指南介绍了领域管理扩展(RME),这是该体系结构的扩展。 RME是Arm机密计算架构(Arm CCA)的硬件组件还包括软件元素。RME动态地将资源和内存传输到一个新的受保护的地址空间,更高特权
    发表于 08-02 11:40

    003. 任务003: NLP定义以及歧义性 #硬声创作季

    nlp
    充八万
    发布于 :2023年07月05日 14:39:10

    LSPTM在军事C2领域的潜在应用

            超大预训练模型(large scale pre-trained model, LSPTM) 的发展在人工智能领域产生了意想不到的效果, 尤其是在自然语言处理(natural
    的头像 发表于 06-27 11:23 577次阅读
    LSPTM在军事C2<b class='flag-5'>领域</b>的潜在应用

    NLP中的迁移学习:利用预训练模型进行文本分类

    迁移学习彻底改变了自然语言处理(NLP领域,允许从业者利用预先训练的模型来完成自己的任务,从而大大减少了训练时间和计算资源。在本文中,我们将讨论迁移学习的概念,探索一些流行的预训练模型,并通过实际示例演示如何使用这些模型进行文本分类。我们将使用拥抱面转换器库来实现。
    发表于 06-14 09:30 311次阅读

    做实大模型的产业价值,度小满深耕“NLP+金融”

    从度小满NLP开始,去看看AI走向产业的应用落地如何实现
    的头像 发表于 05-18 20:43 439次阅读
    做实大模型的产业价值,度小满深耕“<b class='flag-5'>NLP</b>+金融”