0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自然语言分析NLA技术的发展史

环音仪说数据 来源:环音仪说数据 作者:环音仪说数据 2022-05-11 15:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、什么是自然语言处理

自然语言处理(Natural Language Processing,简称NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人工智能的一个分支,是计算机科学与语言学的交叉学科。由于自然语言是人类区别于其他动物的根本标志,没有语言,人类的思维也就无从谈起,所以NLP体现了人工智能的最高任务与境界。也就是说,只有当计算机具备了处理自然语言的能力时,机器才算实现了真正的智能。

从技术角度看,NLP包括序列标注、分类任务、句子关系判断和生成式任务等。从应用角度看,NLP具有广泛的应用场景,例如:机器翻译、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等等。它涉及与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究和与语言计算相关的语言学研究等。

NLP的兴起与机器翻译这一具体任务有着密切联系。“人工智能”被作为一个研究问题正式提出来的时候,创始人把计算机国际象棋和机器翻译作为两个标志性的任务,认为只要国际象棋系统能够打败人类世界冠军,机器翻译系统达到人类翻译水平,就可以宣告人工智能的胜利。四十年后的1997年,IBM公司的深蓝超级计算机已经能够打败国际象棋世界冠军卡斯帕罗夫。而机器翻译到现在仍无法与人类翻译水平相比,由此可见NLP有多么的复杂和困难!

二、自然语言处理的发展趋势

目前,人们主要通过两种思路来进行自然语言处理,一种是基于规则的理性主义,另外一种是基于统计的经验主义。理性主义方法认为,人类语言主要是由语言规则来产生和描述的,因此只要能够用适当的形式将人类语言规则表示出来,就能够理解人类语言,并实现语言之间的翻译等各种NLP任务。而经验主义方法则认为,从语言数据中获取语言统计知识,有效建立语言的统计模型。因此只要能够有足够多的用于统计的语言数据,就能够理解人类语言。然而,当面对现实世界充满模糊与不确定性时,这两种方法都面临着各自无法解决的问题。例如,人类语言虽然有一定的规则,但是在真实使用中往往伴随大量的噪音和不规范性。理性主义方法的一大弱点就是鲁棒性差,只要与规则稍有偏离便无法处理。而对于经验主义方法而言,又不能无限地获取语言数据进行统计学习,因此也不能够完美地理解人类语言。二十世纪八十年代以来的趋势就是,基于语言规则的理性主义方法不断受到质疑,大规模语言数据处理成为目前和未来一段时期内NLP的主要研究目标。统计学习方法越来越受到重视,自然语言处理中越来越多地使用机器自动学习的方法来获取语言知识。

随着2013年word2vec技术的发表,以神经网络为基础的深度学习技术开始在NLP中广泛使用,深度学习的分布式语义表示和多层网络架构具有强大的拟合和学习能力,显著提升了NLP各种任务的性能,成为现阶段NLP的主要技术方案。

深度学习是纯数据驱动技术方案,需要从大规模标注数据中学习特定任务相关的复杂模式。一方面,有些学者开始探索面向大规模无标注文本数据的深度学习模型,如ELMo,GPT、BERT等,可以看做从大规模数据中学习知识的极致探索;另一方面,现有深度学习技术尚未考虑人类积累的丰富知识(包括语言知识、世界知识、常识知识、认知知识、行业知识等),如果将深度学习看做经验主义方法,将符号知识看做理性主义方法,那么如何充分发挥基于规则的理性主义方法和基于统计的经验主义方法的优势,两者互相补充,更好、更快地进行自然语言处理,仍然是我们需要探索的重要课题。

三、自然语言处理在BI的应用

2018年,Gartner 在其发布的魔力象限报告中,明确指出增强型分析功能是 BI 产品发展的最重要、也是最显著的发展趋势之一,其原因并不难理解:“当前企业使用的数据的规模和复杂度已经逐渐超过人类可以处理的程度,静态报表、仪表板等传统工具已经不能满足需求,而通过机器学习、人工智能等技术增强分析,可以更好地处理这些数据。而如果利用自然语言处理、人工智能等技术的增强分析就可以自动、快速地对数据进行分析,辅助分析人员得到需要的数据洞察。”

作为连续多年入选“Gartner增强分析代表厂商”和“Gartner中国人工智能创业公司代表厂商(2020)”的Smartbi正是看到了这些趋势,在2018年便开始自主研发增强分析工具Smartbi NLA,期望通过引入自然语言处理、知识图谱、推荐算法和机器问答等人工智能技术,使得Smartbi NLA可以理解用户的数据分析需求,并帮助其快速完成分析任务获得数据洞见。

Smartbi NLA的交互式对话实际上是一种特定的语义分析任务。在学术界,类似的任务最早可以追溯到1970年代提出的自然语言编程(Natural-language programming),是指将自然语言(研究比较多的是英语)翻译为特定的编程语言。在1980年代,人们又针对关系性数据库提出了自然语言数据库查询(Natural Language Database Query),也称为Text2SQL、NL2SQL等。它将用户的自然语句转为可以执行的SQL语句,从而免除业务用户学习SQL语言的烦恼,成功将NLP应用于BI领域。

Smartbi正是利用了NL2SQL技术,将自然语言通过神经网络转化为计算机可以识别的数据库查询语言。用户通过语音或者键盘输入后,“AI智能小麦”会将输入的自然语言转为语言元模型的形式,通过小麦内置的知识抽取算法,经过深度学习模型将元模型转化为机器可以理解的数据库语言。最后通过Smartbi预置的查询引擎和图形引擎,快速准确的找到用户想要的查询结果,自动生成图形输出,也可以在Smartbi中对查询结果进行组合和进一步分析。

pYYBAGJ7aY2AIZoPAAKxw2Cq8Xc874.png

图:NL2SQL模型原理示意图

Smartbi NLA是时下前沿的数据分析工具,简化为搜索引擎,仅仅只有一个输入框,页面直接输入描述业务问题,工具自动把数据查询出来,免去学习操作的过程,特别适合在展厅大屏、领导办公室大屏等场合使用,一经推出便广受客户欢迎。

1、Smartbi自然语言查询:临危受命

2、Smartbi自然语言查询:游刃有余

3、Smartbi自然语言查询:堪当大任

4、Smartbi自然语言查询:如影相随

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    24972
  • 数据分析
    +关注

    关注

    2

    文章

    1508

    浏览量

    35945
  • 数据可视化
    +关注

    关注

    0

    文章

    486

    浏览量

    11330
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ‌基于NLA9306电压电平转换器的技术深度解析与应用指南

    安森美 NLA9306电压电平转换器是双路双向I^2^C总线SMBus电压电平转换器,具有使能 (EN) 输入。这些器件的工作电压为1.0V至3.6V [V ~ ref(1)~ ] 和1.8V至
    的头像 发表于 11-25 14:01 194次阅读
    ‌基于<b class='flag-5'>NLA</b>9306电压电平转换器的<b class='flag-5'>技术</b>深度解析与应用指南

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知声提交的《面向门诊病历生成的高质量医患对话合成技术
    的头像 发表于 11-10 17:30 526次阅读
    云知声论文入选<b class='flag-5'>自然语言</b>处理顶会EMNLP 2025

    HarmonyOSAI编程自然语言代码生成

    安装CodeGenie后,在下方对话框内,输入代码需求描述,将根据描述智能生成代码,生成内容可一键复制或一键插入至编辑区当前光标位置。 提问示例 使用ArkTs语言写一段代码,在页面中间部分
    发表于 09-05 16:58

    北斗生态环境监测站:读懂自然的 “语言

    北斗生态环境监测站:读懂自然的 “语言”柏峰【BF-BDQX】当生态监测遇上北斗技术,一场关于 “精准守护自然” 的变革正悄然发生 ——北斗生态环境监测站以北斗定位导航系统为核心
    的头像 发表于 09-04 10:59 330次阅读
    北斗生态环境监测站:读懂<b class='flag-5'>自然</b>的 “<b class='flag-5'>语言</b>”

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    )真香,是不是可以没有YOLO和OCR了? - 北京合众恒跃科技有限公司 - 电子技术论坛 - 广受欢迎的专业电子论坛!已经详细介绍了,这里不再赘述。 四、测试验证:用自然语言控制开发板 启动服务器
    发表于 08-23 13:10

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能(AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到
    的头像 发表于 07-16 15:01 1205次阅读

    云知声四篇论文入选自然语言处理顶会ACL 2025

    近日,第63届国际计算语言学年会ACL 2025(Annual Meeting of the Association for Computational Linguistics,简称ACL)论文接收
    的头像 发表于 05-26 14:15 1050次阅读
    云知声四篇论文入选<b class='flag-5'>自然语言</b>处理顶会ACL 2025

    自然语言处理的发展历程和应用场景

    你是否曾经对着手机说:“嘿,Siri,今天天气怎么样?”或者在出国旅行时,打开翻译软件,对着菜单说:“请把这道菜翻译成英文”。
    的头像 发表于 04-17 11:40 1146次阅读

    半导体材料发展史:从硅基到超宽禁带半导体的跨越

    半导体材料是现代信息技术的基石,其发展史不仅是科技进步的缩影,更是人类对材料性能极限不断突破的见证。从第一代硅基材料到第四代超宽禁带半导体,每一代材料的迭代都推动了电子器件性能的飞跃。 1 第一代
    的头像 发表于 04-10 15:58 2316次阅读

    自然语言提示原型在英特尔Vision大会上首次亮相

    在英特尔Vision大会上,Network Optix首次展示了自然语言提示原型,该方案将重新定义视频管理,为各行各业由AI驱动的洞察和效率提速。
    的头像 发表于 04-09 09:30 794次阅读

    语言模型的解码策略与关键优化总结

    技术参考。主要涵盖贪婪解码、束搜索、采样技术等核心解码方法,以及温度参数、惩罚机制等关键优化手段。大型语言模型的技术基础大型语言模型是当代
    的头像 发表于 02-18 12:00 1076次阅读
    大<b class='flag-5'>语言</b>模型的解码策略与关键优化总结

    监控摄像头的发展史

    从第一代摄像机发展到现在,摄像机取得了巨大的发展,从黑白到彩色,从普通枪机到一体机,从模拟到数字,从标清到高清,从非智能到智能。 1 模拟时代  模拟时代,即在模拟监控系统的时代。 上个世纪60年代
    的头像 发表于 02-14 14:38 3980次阅读
    监控摄像头的<b class='flag-5'>发展史</b>

    望获实时Linux系统与大语言模型深度融合,开创实时智能无限可能!

    语言模型的崛起为智能化应用开辟了新的可能性。借助深度学习技术,这些模型能够理解和生成自然语言,处理复杂的文本和语义信息。这使得它们在诸如人机问答、内容生成和数据分析等领域展现出巨大的
    的头像 发表于 01-08 13:44 1045次阅读

    日海智能无线通信模组的发展史

    随着无线通信技术的飞速发展,我们见证了从2G到5G的革命性跨越。日海模组,作为这场通信技术的见证者和推动者,始终走在行业前列,引领着无线通信模组的创新与发展,成为连接世界的桥梁。
    的头像 发表于 12-18 14:42 1166次阅读

    浅谈显示屏的发展史

    显示器如今已成为日常办公、娱乐不可或缺的一部分,它是人们与机器之间交互的窗口,随着显示器技术的不断发展,也让人机交互体验提升了一个又一个新的台阶,时至今日,历经超100年的发展。从早期的黑白世界到彩色世界,显示器走过了漫长而艰辛
    的头像 发表于 12-18 09:12 3777次阅读