0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI与录音笔相结合的智能录音笔

我快闭嘴 来源:通信世界网 作者:舒文琼 2020-07-03 10:16 次阅读

科技让生活更美好——这是科技从业者的初心,也是ICT创新的终极目标,在技术发展的道路上体现得淋漓尽致。以AI为例,将AI与录音笔相结合的智能录音笔,把聋哑人带出了“无声的世界”。例如,西安有个聋哑人工程师,过去开会只能看PPT,无法参与讨论,自从用了智能录音笔,这位工程师可以用录音笔看到沟通互动环节内容,自身的才智得到了更充分的发挥,也拉近了与同事的距离。

科技创新、造福人类是一项永无止境的使命。在发布智能录音笔一周年之际,科大讯飞宣布将录音笔的三大核心功能再次升级,即录音更专业、转写更强大、编辑更智能,而录音笔行业的四大标准识别准、录得远、录得清、语种全也得到了新的定义。

AI赋能,录音笔市场产生颠覆性变革

科大讯飞发布全新旗舰产品讯飞智能录音笔,不仅实现了专业级降噪拾音,还搭载了AI技术,支持语音实时转文字等诸多功能。这是AI技术落地的有益尝试,而纵观全球,将AI与录音笔相结合,科大讯飞走在了创新的最前沿。

结合AI特色优势的录音笔,给整个行业带来了巨大变化,甚至产生了颠覆性的效果。例如,听障人士可以用录音笔把语音转成文字,减少沟通障碍;听非母语演讲时,可以通过录音笔转成母语,部分代替了同传功能。而这些,只是讯飞智能录音笔的部分应用场景。

借助颠覆性的创新,科大讯飞1年以来取得了不俗的表现。科大讯飞副总裁兼消费者事业群副总裁李传刚表示,在2019年双11中,讯飞智能录音笔一跃登顶成为天猫&京东双平台录音笔品类和单品销售额双料冠军,11号当日京东成交金额指数更是超过其他品牌之和。凭借优秀的外观设计,讯飞智能录音笔获得iF设计大奖,通过其强劲的性能和优质的使用体验斩获亚洲消费电子展创新奖,京东电脑数码年度最佳新品,脉脉年度盛典最喜欢数码产品以及中国品牌日国货新品。

就在2019年,讯飞智能录音笔已经进驻全国2000多家门店。李传刚表示,科大讯飞是唯一一家一年内进驻门店达到2000家的录音笔厂商,这背后是其对消费者体验的重视,因为每扩张一家门店,都需要资金和人力的投入。李传刚表示,2020年科大讯飞将继续发力,将门店数量扩大到3000家以上。

放眼全球,科大讯飞的足迹已经遍布六大洲,智能录音产品覆盖了全球各地的用户。

功能升级:录音更专业、转写更强大、编辑更智能

市场领先者之所以能够保持领先,不仅因为其产品能够有效满足市场需求,更因为其深刻洞察市场趋势,不断进行技术创新,在技术产品创新的过程中,也在定义和引领行业标准。

在智能录音笔方面,随着5月新品的发布,科大讯飞在行业内确立了录音笔的新方向。这一方向也得到了一些厂商的跟随,一年来,在语种识别、新技术使用、后续文字处理方面,市场上也有一些产品面世。但是鉴于市场处于起步阶段,产品性能参差不齐。针对这一情况,科大讯飞提出了录音笔标准:识别准、录得远、录得清、语种全。

在发布会上,科大讯飞执行总裁胡郁宣布对讯飞智能录音笔三大升级,包括录音更专业、转写更强大、编辑更智能。此次升级标志着讯飞转写引擎,从前端录音、核心转写能力,再到后端用户编辑,均进行了全面升级。

在录音方面,讯飞智能录音新增支持录音声源定位,通过判断声源方向,实现更好的拾音效果。同时,产品增加非人声过滤,在音频播放时,可自动跳过没有人声的冗余录音,有效节约整理时间;而高增益降噪,使得产品在5-15米录音时,转写准确率提升30%,同时人声更加清晰。

在转写方面,讯飞智能录音笔新增粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话、甘肃话、山东话、太原话12种方言,行业首发藏语、维吾尔语2种少数名族语,并支持中、英、日、韩、俄、法、越南、西班牙8种语言转写。值得一提的是,升级后的讯飞智能录音笔SR系列支持IT科技、财经贸易、文化体育、医疗、政法、运营商、教育7大专业领域转写优化,保证特定语境下的转写正确率。同时,中英文混读识别功能也可在转写时自动识别夹杂着中英文的语音内容。

为了让用户更快速和准确地产出转写后的内容,讯飞智能录音笔进一步升级了智能编辑功能。智能语义分段可以根据语义的上下文进行分段,提升了用户针对转写文档的浏览体验;自动区分讲话人可实现根据录音及转写结果自动区分标注讲话人,一些特定采访情景下转出来的文档可以更方便的根据不同发言人查对内容;口语规整则可将语气词、重复词、无意义词过滤掉,展示更纯净的转写内容;智能摘要则是对录音内容进行全面的语义理解与分析,自动抽取关键信息,形成摘要结果;而个人词库可通过提前输入专属词汇,进行转写编辑优化。

再次定义录音笔行业四大标准

讯飞智能录音笔一直沿袭着识别准、录得远、录得清、语种全的四大标准,此次伴随着功能升级,讯飞对上述标准进行了新的定义。

识别准方面,讯飞智能录音笔语音识别模块采用基于深度全序列卷积神经网络的语音识别框架,识别准确率达98%;录得远方面,讯飞智能录音笔SR系列旗舰产品拾音距离最远可达15米;录得清方面,讯飞智能录音笔采用AI算法降噪处理前端语音信号保证拾音的准确性,并提供高清无损音质的音频格式;语种全方面,讯飞智能录音笔支持12种方言转写、2种少数名族语言转写、8种语言转写和7大专业领域转写优化。

除此之外,讯飞智能录音笔作为AI带屏录音笔的开创者支持1小时的会议录音,5分钟即可转写完成。其拥有丰富的“智能”功能,在文件管理上,满足了各场景记录者方便录、查找易、编辑快等需求。对于大量的文件素材,用户可利用内置的语音助手,通过语音就可以在海量的录音文件中搜索录音内容,一键直达重点处。此外,基于云账号,讯飞智能录音笔还支持用户在录音笔、手机APP、网页等多个客户端自动同步和管理数据,同时还能进行录音回听、文稿编辑、一键导出等操作,对用户来说大大增加了整理工作的便捷性。

硬件层面,讯飞智能录音笔也使用了专业级配置如2+6麦克风阵列组合,支持4G、WIFI等多种网络连接方式,指纹解锁模块,2000毫安时大容量电池并支持快充。讯飞智能录音笔能在会议、采访、演出、音乐会等不同录音场景下,调动8个麦克风实现录音以及360度环绕无死角收声。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能
    +关注

    关注

    8

    文章

    1680

    浏览量

    116936
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264041
  • 录音笔
    +关注

    关注

    0

    文章

    86

    浏览量

    12916
收藏 人收藏

    评论

    相关推荐

    鸿蒙开发实战项目:录音变声应用

    没有设置,默认是正常录音的速度,设置完成以后点击开始录音,启动录音功能,点击录音结束后,停止录音录音
    发表于 03-01 17:24

    X2000系列北京君正CPU: 外研通点读VT-6C

      随着科技的不断发展,越来越多的智能化教育工具进入人们的视野。在这篇文章中,我们将详细介绍一款专为英语学习打造的得力助手——外研通点读VT-6C。这款点读以其优秀的性能、独特的特点和诸多优势
    发表于 12-13 18:00

    怎么解决带电插拔过程的USB电流过冲问题?

    将一个简单的录音笔或其它外设插入USB端口时,可能导致不希望发生的系统复位。
    的头像 发表于 12-09 10:08 889次阅读
    怎么解决带电插拔过程的USB电流过冲问题?

    录放音语音芯片与采样率:揭秘WT588F02A-16S录音芯片支持的录音采样率

    在数字音频领域,录音芯片和录音采样率是决定音频质量的关键因素。本文将以WT588F02A-16S录音芯片为例,探讨录音芯片和录音采样率之间的
    的头像 发表于 11-30 09:49 229次阅读

    录放音语音芯片与采样率:揭秘WT588F02A-16S录音芯片支持的录音采样率

    在数字音频领域,录音芯片和录音采样率是决定音频质量的关键因素。本文将以WT588F02A-16S录音芯片为例,探讨录音芯片和录音采样率之间的
    的头像 发表于 11-30 09:44 210次阅读
    录放音语音芯片与采样率:揭秘WT588F02A-16S<b class='flag-5'>录音</b>芯片支持的<b class='flag-5'>录音</b>采样率

    WT2003H系列MP3录音芯片:控制方式灵活,高品质录音与内置功放完美结合

    在音频技术日新月异的今天,一款功能强大、性能稳定的录音芯片对于电子产品的重要性不言而喻。而唯创知音的WT2003H系列MP3录音芯片,凭借其灵活的控制方式、高品质录音功能以及内置的D类功放,成为了市场上备受瞩目的明星产品。
    的头像 发表于 11-29 09:42 225次阅读

    唯创知音WT2003H系列MP3录音语音芯片:多样封装,录音时长可达70S,满足各种应用需求

    在日益发展的电子产品市场中,音频芯片作为产品的重要组成部分,对于提升用户体验和产品质量具有不可忽视的作用。唯创知音的WT2003H系列MP3录音芯片便是其中的佼佼者,其录音时长最多可录70S(采样率
    的头像 发表于 11-29 09:37 179次阅读
    唯创知音WT2003H系列MP3<b class='flag-5'>录音</b>语音芯片:多样封装,<b class='flag-5'>录音</b>时长可达70S,满足各种应用需求

    语音芯片怎么录音 以及如何选择合适的录音芯片

    语音芯片怎么录音 以及如何选择合适的录音芯片 语音芯片,其中就有一个品类,称之为录音芯片 其实他们是合并在一个芯片里面的,也就是说,录音芯片肯定是又可以录又可以播 但是能播放的语
    的头像 发表于 10-30 15:02 444次阅读
    语音芯片怎么<b class='flag-5'>录音</b> 以及如何选择合适的<b class='flag-5'>录音</b>芯片

    点读是通过什么原理检测文字的?

    点读是通过什么原理检测文字的发音的
    发表于 09-27 07:39

    JK405R-SOP16录音芯片ic方案的功能简介,可以内置录音30秒-高采样率

    JK405R是一颗SOP16封装的录音芯片,专用于录音的应用,芯片内置了30秒的录音空间,同时还支持外扩
    的头像 发表于 09-24 09:34 417次阅读
    JK405R-SOP16<b class='flag-5'>录音</b>芯片ic方案的功能简介,可以内置<b class='flag-5'>录音</b>30秒-高采样率

    录放音模块的使用教程 录音笔 语音播报

    模块
    学习电子知识
    发布于 :2023年07月17日 19:42:21

    基于音频芯片WT2605的录音笔方案

    整套系统主要由WT2605芯片+4G或者WiFi/BLE模组组成,通过WT2605采集MIC的数据,将数据编码后存储到SPI FLash或者TF卡内,同时通过UART串口将录音数据发给4G或者WiFi/BLE模块上传到服务器或者手机APP进行保存,实现本地录音数据的存储和
    发表于 07-13 10:50 857次阅读
    基于音频芯片WT2605的<b class='flag-5'>录音笔</b>方案

    基于树莓派的电话录音系统研究

    电话录音系统广泛应用于电力通信中,它在调度语音下达的过程中起着重要的作用。然而传统的录音系统存在占地面积过大、查询录音信息不方便等问题,鉴于此,运用深度神经网络-隐马尔可夫模型(DNN-HMM模型
    的头像 发表于 06-26 14:10 677次阅读
    基于树莓派的电话<b class='flag-5'>录音</b>系统研究

    Hi3861:智能录音笔【WM8978录放音】

    传输给MCU,此为ADC过程,即录音。WM8978还使用I2C接口配置其工作参数,比如音量,EQ,3D环绕等。WM8978本身可直连1W/8欧的小喇叭。
    的头像 发表于 06-14 10:24 1753次阅读
    Hi3861:<b class='flag-5'>智能</b><b class='flag-5'>录音笔</b>【WM8978录放音】

    Hi3861:智能录音笔【环境搭建+配网】

    /BV1PY41147z8 一、课题详情 1、项目描述 基于OpenHarmony开发一款智能录音笔,功能如下: 1,能够支持录音 2,支持配网 3,支持录音上传生成文稿 2、项目产出
    的头像 发表于 06-14 10:23 1072次阅读
    Hi3861:<b class='flag-5'>智能</b><b class='flag-5'>录音笔</b>【环境搭建+配网】