0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自然语言分析NLA技术的发展史

环音仪说数据 来源:环音仪说数据 作者:环音仪说数据 2022-05-11 15:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、什么是自然语言处理

自然语言处理(Natural Language Processing,简称NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人工智能的一个分支,是计算机科学与语言学的交叉学科。由于自然语言是人类区别于其他动物的根本标志,没有语言,人类的思维也就无从谈起,所以NLP体现了人工智能的最高任务与境界。也就是说,只有当计算机具备了处理自然语言的能力时,机器才算实现了真正的智能。

从技术角度看,NLP包括序列标注、分类任务、句子关系判断和生成式任务等。从应用角度看,NLP具有广泛的应用场景,例如:机器翻译、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等等。它涉及与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究和与语言计算相关的语言学研究等。

NLP的兴起与机器翻译这一具体任务有着密切联系。“人工智能”被作为一个研究问题正式提出来的时候,创始人把计算机国际象棋和机器翻译作为两个标志性的任务,认为只要国际象棋系统能够打败人类世界冠军,机器翻译系统达到人类翻译水平,就可以宣告人工智能的胜利。四十年后的1997年,IBM公司的深蓝超级计算机已经能够打败国际象棋世界冠军卡斯帕罗夫。而机器翻译到现在仍无法与人类翻译水平相比,由此可见NLP有多么的复杂和困难!

二、自然语言处理的发展趋势

目前,人们主要通过两种思路来进行自然语言处理,一种是基于规则的理性主义,另外一种是基于统计的经验主义。理性主义方法认为,人类语言主要是由语言规则来产生和描述的,因此只要能够用适当的形式将人类语言规则表示出来,就能够理解人类语言,并实现语言之间的翻译等各种NLP任务。而经验主义方法则认为,从语言数据中获取语言统计知识,有效建立语言的统计模型。因此只要能够有足够多的用于统计的语言数据,就能够理解人类语言。然而,当面对现实世界充满模糊与不确定性时,这两种方法都面临着各自无法解决的问题。例如,人类语言虽然有一定的规则,但是在真实使用中往往伴随大量的噪音和不规范性。理性主义方法的一大弱点就是鲁棒性差,只要与规则稍有偏离便无法处理。而对于经验主义方法而言,又不能无限地获取语言数据进行统计学习,因此也不能够完美地理解人类语言。二十世纪八十年代以来的趋势就是,基于语言规则的理性主义方法不断受到质疑,大规模语言数据处理成为目前和未来一段时期内NLP的主要研究目标。统计学习方法越来越受到重视,自然语言处理中越来越多地使用机器自动学习的方法来获取语言知识。

随着2013年word2vec技术的发表,以神经网络为基础的深度学习技术开始在NLP中广泛使用,深度学习的分布式语义表示和多层网络架构具有强大的拟合和学习能力,显著提升了NLP各种任务的性能,成为现阶段NLP的主要技术方案。

深度学习是纯数据驱动技术方案,需要从大规模标注数据中学习特定任务相关的复杂模式。一方面,有些学者开始探索面向大规模无标注文本数据的深度学习模型,如ELMo,GPT、BERT等,可以看做从大规模数据中学习知识的极致探索;另一方面,现有深度学习技术尚未考虑人类积累的丰富知识(包括语言知识、世界知识、常识知识、认知知识、行业知识等),如果将深度学习看做经验主义方法,将符号知识看做理性主义方法,那么如何充分发挥基于规则的理性主义方法和基于统计的经验主义方法的优势,两者互相补充,更好、更快地进行自然语言处理,仍然是我们需要探索的重要课题。

三、自然语言处理在BI的应用

2018年,Gartner 在其发布的魔力象限报告中,明确指出增强型分析功能是 BI 产品发展的最重要、也是最显著的发展趋势之一,其原因并不难理解:“当前企业使用的数据的规模和复杂度已经逐渐超过人类可以处理的程度,静态报表、仪表板等传统工具已经不能满足需求,而通过机器学习、人工智能等技术增强分析,可以更好地处理这些数据。而如果利用自然语言处理、人工智能等技术的增强分析就可以自动、快速地对数据进行分析,辅助分析人员得到需要的数据洞察。”

作为连续多年入选“Gartner增强分析代表厂商”和“Gartner中国人工智能创业公司代表厂商(2020)”的Smartbi正是看到了这些趋势,在2018年便开始自主研发增强分析工具Smartbi NLA,期望通过引入自然语言处理、知识图谱、推荐算法和机器问答等人工智能技术,使得Smartbi NLA可以理解用户的数据分析需求,并帮助其快速完成分析任务获得数据洞见。

Smartbi NLA的交互式对话实际上是一种特定的语义分析任务。在学术界,类似的任务最早可以追溯到1970年代提出的自然语言编程(Natural-language programming),是指将自然语言(研究比较多的是英语)翻译为特定的编程语言。在1980年代,人们又针对关系性数据库提出了自然语言数据库查询(Natural Language Database Query),也称为Text2SQL、NL2SQL等。它将用户的自然语句转为可以执行的SQL语句,从而免除业务用户学习SQL语言的烦恼,成功将NLP应用于BI领域。

Smartbi正是利用了NL2SQL技术,将自然语言通过神经网络转化为计算机可以识别的数据库查询语言。用户通过语音或者键盘输入后,“AI智能小麦”会将输入的自然语言转为语言元模型的形式,通过小麦内置的知识抽取算法,经过深度学习模型将元模型转化为机器可以理解的数据库语言。最后通过Smartbi预置的查询引擎和图形引擎,快速准确的找到用户想要的查询结果,自动生成图形输出,也可以在Smartbi中对查询结果进行组合和进一步分析。

pYYBAGJ7aY2AIZoPAAKxw2Cq8Xc874.png

图:NL2SQL模型原理示意图

Smartbi NLA是时下前沿的数据分析工具,简化为搜索引擎,仅仅只有一个输入框,页面直接输入描述业务问题,工具自动把数据查询出来,免去学习操作的过程,特别适合在展厅大屏、领导办公室大屏等场合使用,一经推出便广受客户欢迎。

1、Smartbi自然语言查询:临危受命

2、Smartbi自然语言查询:游刃有余

3、Smartbi自然语言查询:堪当大任

4、Smartbi自然语言查询:如影相随

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    25125
  • 数据分析
    +关注

    关注

    2

    文章

    1523

    浏览量

    36368
  • 数据可视化
    +关注

    关注

    0

    文章

    503

    浏览量

    11534
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vibe Coding AI全栈开发实战

    生成完整的代码实现。开发者从代码编写者转变为系统架构师和需求验证者,将更多精力聚焦于业务逻辑、系统设计和用户体验等核心环节。 效率翻倍:Vibe Coding的独特优势 1. 自然语言交互,降低技术
    发表于 04-15 16:02

    利用高密度内存显著优化人工智能欺诈检测的基础设施成本

    人工智能欺诈检测是金融科技公司的一项关键工作。欺诈监控涉及多种机制,例如采用自然语言处理技术筛选通信中的可疑内容、利用机器学习区分欺诈交易和合法交易,以及运用分析技术区分正常用户行为和
    的头像 发表于 03-10 09:47 696次阅读

    自然语言处理NLP的概念和工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的一个分支,它会教计算机如何理解口头和书面形式的人类语言自然语言处理将计算语言学与机器学习和深度学习相结合来处理语音和文本数据,这些数
    的头像 发表于 01-29 14:01 617次阅读
    <b class='flag-5'>自然语言</b>处理NLP的概念和工作原理

    LoRaWAN协议,如何促进人与自然的和谐发展

    LoRaWAN促进人与自然和谐发展,实现生态监测、动物保护与数据支撑。
    的头像 发表于 01-13 14:24 362次阅读
    LoRaWAN协议,如何促进人与<b class='flag-5'>自然</b>的和谐<b class='flag-5'>发展</b>?

    ‌基于NLA9306电压电平转换器的技术深度解析与应用指南

    安森美 NLA9306电压电平转换器是双路双向I^2^C总线SMBus电压电平转换器,具有使能 (EN) 输入。这些器件的工作电压为1.0V至3.6V [V ~ ref(1)~ ] 和1.8V至
    的头像 发表于 11-25 14:01 865次阅读
    ‌基于<b class='flag-5'>NLA</b>9306电压电平转换器的<b class='flag-5'>技术</b>深度解析与应用指南

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知声提交的《面向门诊病历生成的高质量医患对话合成技术
    的头像 发表于 11-10 17:30 908次阅读
    云知声论文入选<b class='flag-5'>自然语言</b>处理顶会EMNLP 2025

    HarmonyOSAI编程自然语言代码生成

    安装CodeGenie后,在下方对话框内,输入代码需求描述,将根据描述智能生成代码,生成内容可一键复制或一键插入至编辑区当前光标位置。 提问示例 使用ArkTs语言写一段代码,在页面中间部分
    发表于 09-05 16:58

    北斗生态环境监测站:读懂自然的 “语言

    北斗生态环境监测站:读懂自然的 “语言”柏峰【BF-BDQX】当生态监测遇上北斗技术,一场关于 “精准守护自然” 的变革正悄然发生 ——北斗生态环境监测站以北斗定位导航系统为核心
    的头像 发表于 09-04 10:59 642次阅读
    北斗生态环境监测站:读懂<b class='flag-5'>自然</b>的 “<b class='flag-5'>语言</b>”

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    )真香,是不是可以没有YOLO和OCR了? - 北京合众恒跃科技有限公司 - 电子技术论坛 - 广受欢迎的专业电子论坛!已经详细介绍了,这里不再赘述。 四、测试验证:用自然语言控制开发板 启动服务器
    发表于 08-23 13:10

    开脑洞,Modbus为什么叫Modbus?

    Modbus 协议为什么叫这个名字?本文带你回到 1979 年,揭秘 Modbus 名字的由来,梳理其从 RTU、ASCII 到 TCP 的发展史,回顾在 Modbus 出现之前 PLC 是如何通讯
    的头像 发表于 08-22 11:13 1516次阅读

    聊聊倒装芯片凸点(Bump)制作的发展史

    凸点(Bump)是倒装芯片的“神经末梢”,其从金凸点到Cu-Cu键合的演变,推动了芯片从平面互连向3D集成的跨越。未来,随着间距缩小至亚微米级、材料与工艺的深度创新,凸点将成为支撑异构集成、高带宽芯片的核心技术,在AI、5G、汽车电子等领域发挥关键作用。
    的头像 发表于 08-12 09:17 7467次阅读
    聊聊倒装芯片凸点(Bump)制作的<b class='flag-5'>发展史</b>

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能(AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到
    的头像 发表于 07-16 15:01 2339次阅读

    轮边驱动电机专利技术发展

    ,具有较高的灵敏度。 本文主要以 DWPI 专利数据库以及 CNABS 数据库中的检索结果为分析样本,从专利文献的视角对轮边驱动电机的技术发展进行了全面的统计分析,总结了与轮边驱动电机相关的国内和国外
    发表于 06-10 13:15

    云知声四篇论文入选自然语言处理顶会ACL 2025

    近日,第63届国际计算语言学年会ACL 2025(Annual Meeting of the Association for Computational Linguistics,简称ACL)论文接收
    的头像 发表于 05-26 14:15 1470次阅读
    云知声四篇论文入选<b class='flag-5'>自然语言</b>处理顶会ACL 2025

    开关电源接地技术

    一、接地技术发展史1.1、第一阶段:用于雷击保护接地技术的引入最初是为了防止电力或建筑物等遭雷击而采取的保护性措施。在日常生活中我们常见到在各种建筑物上都装有避雷针,其作用就是把雷电产生的雷击电流
    发表于 05-07 14:51