0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大学毕业设计一席谈之四十八 词频统计(1)

通信工程师专辑 来源:未知 2023-05-19 07:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在讲课程《数据结构和算法》的过程中,我给了学生们一个参考例程,希望他们能够从程序中学到词频统计的方法。由于同学们底子比较薄弱,所以给出程序后,我希望同学们能够认真的查阅程序中用到的每个函数,了解其用法,这样才能真正的搞懂程序,遗憾的是我的学生只是完成了实验报告,而程序中很多函数的用法和含义根本就没搞清楚。这种学法是应付式的学法,我极不赞成这样的学习方式。所以才会有了此系列文章。也许是底子弱,也许是不爱学。

面对学生不爱学或者说学习不刻苦的状况,我也只能把这些好的代码传播到网上,让更多人能够借力学习。这也是我现在会更加专注网络传播文章的原因吧。有了词频统计程序,我们就可以在这个基础之上进行扩展,写出更复杂的程序。我就用这样的事例来写出了一个完整的系列文章,告诉大家如何从基础学起,然后再逐步的完善和深入,写出功能更强大的程序,这样的过程走一遍,才算是真正的掌握知识,才能把别人的知识转化为属于自己的知识。写这个系列耗时一个多月,大家看文章花了多长时间呢?有了阶梯,希望大家能好好利用和珍惜。

文本分析对于通信工程专业的学生而言,只是牛刀小试,等到完成词频统计的算法后大家还可以沿这条路继续深入,比如进行语音信号的识别。先进行信号中数字的识别,再进行语义识别。这些可比字符的识别难多了。当下,文本信息已经退居次席,人们更多在意的是语音和视频。因此,语音信号和视频信号处理是当下的技术热点,让我们一起由浅入深的学习吧。本课题可以作为毕业设计的题目,可以根据个人能力适当增加难度。

a7eb3a6a-f5ce-11ed-90ce-dac502259ad0.gif

词频统计主要分为英文词频统计和中文词频统计。英文词频统计很简单,可以借助MATLAB自带函数进行断句,然后再进行统计即可。中文词频统计相对复杂一些。关键在于如何使用合适的语料库和如何精准匹配词语。比如句中出现了“人工智能”四字词,我们应该这四个字视为一个词,而不能分析成为两个词。再者出现生僻词语怎么办?慢慢来,我们先从简单的学起。依旧是老规矩,先看代码!代码中的注释非常清晰,当看完程序后也就明了了。

a7f31f14-f5ce-11ed-90ce-dac502259ad0.png


原文标题:大学毕业设计一席谈之四十八 词频统计(1)

文章出处:【微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 通信网络
    +关注

    关注

    22

    文章

    2098

    浏览量

    53990

原文标题:大学毕业设计一席谈之四十八 词频统计(1)

文章出处:【微信号:gh_30373fc74387,微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高频电路设计的“隐形卫士”:吸波材料的选型与应用

    高频电路设计的“隐形卫士”:吸波材料的选型与应用
    的头像 发表于 12-03 16:53 93次阅读
    高频电路设计的“隐形卫士”:<b class='flag-5'>谈</b>吸波材料的选型与应用

    大学计划 | 同星智能携手大连民族大学民族魂车队,共驱前行!

    同星智能大学教育赞助计划持续推进中,这不仅是同星智能对中国大学生方程式赛车事业的份坚定支持,更是场技术与梦想的双向奔赴。此次携手,双方将全力备战2025中国
    的头像 发表于 09-30 20:05 345次阅读
    <b class='flag-5'>大学</b>计划 | 同星智能携手大连民族<b class='flag-5'>大学</b>民族<b class='flag-5'>之</b>魂车队,共驱前行!

    横河示波器如何使用统计功能呢?

    使用统计功能,可以对波形自动测量的参数进行5种类型的统计:最大值、最小值、平均值、标准偏差、统计运算测量值的个数。我们最多可以统计9个自动测量的项目,而且可以把
    的头像 发表于 07-23 17:49 684次阅读
    横河示波器如何使用<b class='flag-5'>统计</b>功能呢?

    中国人民大学,清华大学:研究用于自供电洪水报警的水触发传感器

    1a,蓝线)。这是过去四十年来全球主要洪水数量增加约700%的主要原因(方案1a,红点)。此外,全球城市化的加速导致世界各地越来越多的地区面临更高的洪水风险(方案1b)。
    的头像 发表于 07-17 18:56 329次阅读
    中国人民<b class='flag-5'>大学</b>,清华<b class='flag-5'>大学</b>:研究用于自供电洪水报警的水触发传感器

    选型指南拒绝纸上兵!芯片原厂工程师教你挑选匹配的充电管理芯片

    产品的市场表现。选择正确的芯片,需要考虑支持的充电协议、电流和电压的自适应能力、能耗效率以及安全功能等。在面对种种技术参数和市场需求时,准确把握芯片的性能指标与未来趋势,才能在激烈的市场竞争中占据一席之地。
    的头像 发表于 07-10 17:59 776次阅读

    NVMe高速传输摆脱XDMA设计六:性能监测单元设计

    、 指令延迟统计信息等。 这些信息存储在性能监测单元中的性能监测寄存器组中, 性能监测寄存器组定义如表1 所示。 表1 性能监测寄存器组定义 想进步了解相关视频,请搜索B站用户:专注
    发表于 07-02 19:51

    华为助力哈尔滨工业大学毕业典礼网络部署保障

    近日,哈尔滨工业大学隆重举行了2025年毕业典礼暨学位授予仪式,送别校三区即将迈向新征程的7203名本科毕业生、4071名硕士毕业生、54
    的头像 发表于 06-26 11:22 801次阅读

    双巨头又要“单飞”,FPGA四十年迎来新变局

    2025年,半导体行业个低调而伟大的发明——FPGA(现场可编程门阵列)——迎来了它的四十周年。这不仅仅是个时间的节点,更像是个充满戏剧性的历史隐喻。就在这个
    发表于 06-09 09:07 1621次阅读
    双巨头又要“单飞”,FPGA<b class='flag-5'>四十</b>年迎来新变局

    SLIP协议及其在直流电能表中的应用

    SLIP协议凭借其简洁性,在直流电能表等嵌入式设备中仍占一席之地。
    的头像 发表于 05-20 14:34 475次阅读
    SLIP协议及其在直流电能表中的应用

    从清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!

    )的产品推广和知识产权布局,推动公司发展走向更广阔的舞台。张大江毕业于清华大学电子信息工程系,大学毕业后就进入了为电子行业。从早期的开关电源设计到现场应用工程师(FAE),再到2013年专注于产品开发
    发表于 05-19 10:16

    墨圆满完成2025大学生工创赛省赛支持工作

    随着近日江西省赛的顺利收官,梦墨对2025中国大学生工程实践与创新能力大赛(以下简称“工创赛”)省赛阶段的支持工作画上圆满句号。梦墨作为赛事技术支持单位,通过前沿技术设备与解决方案,为十余个省市的参赛队伍提供了强有力的创新实
    的头像 发表于 05-14 17:17 816次阅读

    全国大学生电子设计大赛加毕业设计项目合集

    灵敏无线探听器电路资料 高频电路实训装置资料 通过网盘分享的文件:全国大学生电子设计大赛加毕业设计项目合集.zip 链接: https://pan.baidu.com/s/1HB4Egehg29zfs3iHv2N4aQ?pwd=
    发表于 04-15 11:45

    毕业设计实物章节补充!有偿!

    本人的毕业设计是STM32智能风扇系统,运用到的模块有DHT11、L298N和HC-05,我没有做实物,导致仿真以及实物测试章节没办法写,初稿就要交了,想找个大佬提供资料,有偿感谢。
    发表于 02-27 21:05

    《DNESP32S3使用指南-IDF版_V1.6》第四十八章 扫描WiFi实验

    四十八章 扫描WiFi实验 ESP32-S3的WiFi库支持配置及监控ESP32-S3的Wi-Fi连网功能。它支持配置基站模式(即STA模式或WiFi客户端模式),此时ESP32-S3连接到接入点
    发表于 02-12 09:18

    飞凌嵌入式ElfBoard ELF 1板卡-git管理源码git安装和使用

    的资源库,特点是没有严格的服务器概念,每个单体都可作为资源库。这个特点就让我们人人有自己的git仓库这件事变得容易实现。为什么要用git?提到版本控制,总会想起大学毕业时写论文的场景,你电脑上的毕业
    发表于 01-14 09:08