0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大学毕业设计一席谈之四十八 词频统计(1)

通信工程师专辑 来源:未知 2023-05-19 07:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在讲课程《数据结构和算法》的过程中,我给了学生们一个参考例程,希望他们能够从程序中学到词频统计的方法。由于同学们底子比较薄弱,所以给出程序后,我希望同学们能够认真的查阅程序中用到的每个函数,了解其用法,这样才能真正的搞懂程序,遗憾的是我的学生只是完成了实验报告,而程序中很多函数的用法和含义根本就没搞清楚。这种学法是应付式的学法,我极不赞成这样的学习方式。所以才会有了此系列文章。也许是底子弱,也许是不爱学。

面对学生不爱学或者说学习不刻苦的状况,我也只能把这些好的代码传播到网上,让更多人能够借力学习。这也是我现在会更加专注网络传播文章的原因吧。有了词频统计程序,我们就可以在这个基础之上进行扩展,写出更复杂的程序。我就用这样的事例来写出了一个完整的系列文章,告诉大家如何从基础学起,然后再逐步的完善和深入,写出功能更强大的程序,这样的过程走一遍,才算是真正的掌握知识,才能把别人的知识转化为属于自己的知识。写这个系列耗时一个多月,大家看文章花了多长时间呢?有了阶梯,希望大家能好好利用和珍惜。

文本分析对于通信工程专业的学生而言,只是牛刀小试,等到完成词频统计的算法后大家还可以沿这条路继续深入,比如进行语音信号的识别。先进行信号中数字的识别,再进行语义识别。这些可比字符的识别难多了。当下,文本信息已经退居次席,人们更多在意的是语音和视频。因此,语音信号和视频信号处理是当下的技术热点,让我们一起由浅入深的学习吧。本课题可以作为毕业设计的题目,可以根据个人能力适当增加难度。

a7eb3a6a-f5ce-11ed-90ce-dac502259ad0.gif

词频统计主要分为英文词频统计和中文词频统计。英文词频统计很简单,可以借助MATLAB自带函数进行断句,然后再进行统计即可。中文词频统计相对复杂一些。关键在于如何使用合适的语料库和如何精准匹配词语。比如句中出现了“人工智能”四字词,我们应该这四个字视为一个词,而不能分析成为两个词。再者出现生僻词语怎么办?慢慢来,我们先从简单的学起。依旧是老规矩,先看代码!代码中的注释非常清晰,当看完程序后也就明了了。

a7f31f14-f5ce-11ed-90ce-dac502259ad0.png


原文标题:大学毕业设计一席谈之四十八 词频统计(1)

文章出处:【微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 通信网络
    +关注

    关注

    22

    文章

    2113

    浏览量

    54502

原文标题:大学毕业设计一席谈之四十八 词频统计(1)

文章出处:【微信号:gh_30373fc74387,微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA CEO黄仁勋在卡内基梅隆大学2026届毕业典礼发表主题演讲

    卡内基梅隆大学 (Carnegie Mellon University) 第 128 届毕业典礼上发表了主题演讲,他告诉毕业生:“你们正处在个非凡的时代。
    的头像 发表于 05-18 10:49 329次阅读

    退烧级信号神器!是德33250A 深耕多年的经典,每丝信号都藏着极致细腻

    在电子测试发烧圈,真正的好仪器从不是靠参数堆砌博眼球,而是能在细节处彰显实力,经得起反复打磨与实战考验。是德33250A作为函数/任意波形发生器领域的经典机型,虽已停产多年,却依然在发烧玩家、资深工程师的实验室中占据一席之地,凭的就是扎实的信号表现与极致的实用体验,成为不少烧友心中的“退烧
    的头像 发表于 05-13 11:06 198次阅读
    退烧级信号神器!是德33250A 深耕多年的经典,每<b class='flag-5'>一</b>丝信号都藏着极致细腻

    WM8915:超低功耗音频集线器编解码器的卓越

    设计的超低功耗移动编解码器,凭借其丰富的特性和卓越的性能,在市场上占据了一席之地。下面将从多个方面对WM8915进行详细介绍。 文件下载: WM8915ECSN/R.pdf 、产品概述 1. 基本定位 WM8915是
    的头像 发表于 03-27 18:05 1189次阅读

    哈尔滨工业大学与鸿微科技座谈会成功举办

    2月12日,“物理人工智能驱动材料研发新范式—鸿微材料垂类大模型研发”座谈会在哈尔滨工业大学圆满举办。哈工大副校长刘挺教授、鸿微科技董事长曹荣根携校企双方核心力量齐聚堂,多院系专
    的头像 发表于 02-25 16:03 534次阅读

    华东理工大学与鸿微科技座谈交流

    2月10日,华东理工大学化学与分子工程学院党委副书记、纪委书记吕遐,化学与分子工程学院副院长练成,化学与分子工程学院团委书记李俊雯行莅临鸿微科技(上海)股份有限公司(以下简称“鸿
    的头像 发表于 02-24 17:06 1033次阅读

    TPA2005D1:高效滤除的音频放大器设计指南

    选。它以其独特的设计和出色的性能,在便携式音频设备领域占据了一席之地。 文件下载: tpa2005d1.pdf 产品特性亮点 功率与效率的完美结合 TPA2005D1能够在5V电源下
    的头像 发表于 02-04 09:35 372次阅读

    上海大学携手鸿微构建材料智能研发新生态

    1月22日,上海大学与鸿微科技正式牵手,开启场聚焦“材料智能研发”的深度对话。这不仅是场国产化化学绘图软件的捐赠仪式,更是
    的头像 发表于 01-26 15:45 620次阅读

    达实智能董事长刘磅发表2026年新年家书

    2025年,达实智能度过了30岁生日。回想达实智能过去的三十年,创业之初,就像个小朋友,无忧无虑地走过了学龄前时期。然后,像个中学生,经历了面壁十年的苦读时期,终于迎来了考上大学后意气风发的激情时期。最近几年,有点像
    的头像 发表于 01-07 14:14 863次阅读

    电能质量在线监测装置支持多维度统计报表吗?

      是的,主流电能质量在线监测装置普遍支持多维度统计报表功能 ,这是其数据分析能力的核心组成部分,能帮助用户全面评估电网电能质量状况,满足合规性要求和运维决策需求。 、多维度统计的核心维度类型
    的头像 发表于 12-11 16:51 771次阅读

    高频电路设计的“隐形卫士”:吸波材料的选型与应用

    高频电路设计的“隐形卫士”:吸波材料的选型与应用
    的头像 发表于 12-03 16:53 737次阅读
    高频电路设计的“隐形卫士”:<b class='flag-5'>谈</b>吸波材料的选型与应用

    大学计划 | 同星智能携手大连民族大学民族魂车队,共驱前行!

    同星智能大学教育赞助计划持续推进中,这不仅是同星智能对中国大学生方程式赛车事业的份坚定支持,更是场技术与梦想的双向奔赴。此次携手,双方将全力备战2025中国
    的头像 发表于 09-30 20:05 751次阅读
    <b class='flag-5'>大学</b>计划 | 同星智能携手大连民族<b class='flag-5'>大学</b>民族<b class='flag-5'>之</b>魂车队,共驱前行!

    横河示波器如何使用统计功能呢?

    使用统计功能,可以对波形自动测量的参数进行5种类型的统计:最大值、最小值、平均值、标准偏差、统计运算测量值的个数。我们最多可以统计9个自动测量的项目,而且可以把
    的头像 发表于 07-23 17:49 1095次阅读
    横河示波器如何使用<b class='flag-5'>统计</b>功能呢?

    中国人民大学,清华大学:研究用于自供电洪水报警的水触发传感器

    1a,蓝线)。这是过去四十年来全球主要洪水数量增加约700%的主要原因(方案1a,红点)。此外,全球城市化的加速导致世界各地越来越多的地区面临更高的洪水风险(方案1b)。
    的头像 发表于 07-17 18:56 620次阅读
    中国人民<b class='flag-5'>大学</b>,清华<b class='flag-5'>大学</b>:研究用于自供电洪水报警的水触发传感器

    华为助力哈尔滨工业大学毕业典礼网络部署保障

    近日,哈尔滨工业大学隆重举行了2025年毕业典礼暨学位授予仪式,送别校三区即将迈向新征程的7203名本科毕业生、4071名硕士毕业生、54
    的头像 发表于 06-26 11:22 1208次阅读

    双巨头又要“单飞”,FPGA四十年迎来新变局

    2025年,半导体行业个低调而伟大的发明——FPGA(现场可编程门阵列)——迎来了它的四十周年。这不仅仅是个时间的节点,更像是个充满戏剧性的历史隐喻。就在这个
    发表于 06-09 09:07 2070次阅读
    双巨头又要“单飞”,FPGA<b class='flag-5'>四十</b>年迎来新变局