0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于语音转写技术的解析和应用

讯飞开放平台 来源:djl 2019-09-27 14:20 次阅读

信息爆发时代,如何快速有效地处理视频音频、文字等信息变得尤为重要。无论是政企会议、公检法办案,还是教学培训、记者采访、个人录音等场合均需要形成完整的文字记录材料,音视频文件也需要形成字幕。为解决各类场景下的音频转文字问题,语音转写应运而生。

今年7月,讯飞开放平台推出语音转写功能。这项基于科大讯飞独立研究的深度全序列卷积升级网络语音识别框架的技术究竟有哪些核心原理?语音转写的产品特性和优势又有哪些?应用落地的场景以及未来发展前景是什么?这些问题是很多对语音转写感兴趣的小伙伴想要了解的。

本期AI公开课,我们邀请到科大讯飞AI研究院副院长 高建清博士为我们讲解语音转写技术。

什么是语音转写?01

语音转写(LongFormAutomatic Speech Recognition):基于科大讯飞独立研究的深度全序列卷积神经网络语音识别框架(Deep Fully Convolutional Neural Network, DFCNN),针对语音的长时相关性进行语言建模,将音频数据转换成文本数据,可以让信息传递更高效,为后续的数据检索和数据挖掘提供基础。

按照音频传输形式分为

已录制音频(recorded audio):将已经录制好的完整音频文件传输至云端的转写后台,转写完毕之后输出音频对应的完整文字结果。

实时音频流(real-time streaming):在采集音频的同时连续上传音频流至云端,云端实时返回文字结果,可以实现文字和声音的同步展现。

语音转写和语音听写的区别02

语音转写和语音听写很多开发者小伙伴容易混淆,在课程开始之前先把两者的区别给大家梳理清晰:

语音转写应用场景有哪些?03

电话销售&客服

将坐席的通话转换成文字,让电话质检和信息同步更有效率,同时,也为基于文本建模的数据挖掘提供原料基础。

会议&访谈记录

可以将线上或者线下的会议和访谈的音频记录转换成文字存稿,让后期的信息检索以及精细整理更方便快捷。

字幕生成

能够将视频中的音频文件转写成带有的时间戳的文字信息,帮助您轻松生成与视频相对应的字幕文件。

语音鉴别

帮助您从音频转成的文字信息中搜索匹配相关词类,对黄暴或者涉政内容进行快速且高效的鉴别。

场景营销

通过对转写结果与用户自定义的关键词进行搜索匹配,结合对应时间戳信息,进行线上广告投放。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6514

    浏览量

    87613
  • 云端
    +关注

    关注

    0

    文章

    111

    浏览量

    16751
收藏 人收藏

    评论

    相关推荐

    语音数据集:开启智能语音技术的新篇章

    随着人工智能技术的飞速发展,语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据集是训练和优化
    的头像 发表于 12-29 11:06 205次阅读

    语音数据集:智能语音技术的基石与挑战

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要突破口。语音数据集作为支撑语音技术
    的头像 发表于 12-28 11:28 332次阅读

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音技术的灵魂。本文将深入探讨
    的头像 发表于 12-14 14:33 360次阅读

    锁相环技术解析(上)

    锁相环技术解析(上)
    的头像 发表于 11-29 16:51 451次阅读
    锁相环<b class='flag-5'>技术</b><b class='flag-5'>解析</b>(上)

    锁相环技术解析(下)

    锁相环技术解析(下)
    的头像 发表于 11-29 16:39 289次阅读
    锁相环<b class='flag-5'>技术</b><b class='flag-5'>解析</b>(下)

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本,无需依赖网络连
    发表于 11-24 17:41

    电子装联技术解析

    电子装联技术解析
    的头像 发表于 11-23 16:18 406次阅读
    电子装联<b class='flag-5'>技术</b><b class='flag-5'>解析</b>

    智能家居蓬勃发展,智能语音技术日趋关键

    思必驰聚焦“云+芯”战略,基于AI-aaS服务支撑产品方案升级及垂直行业覆盖落地。例如,在智慧办公领域,思必驰自研了会议转写麦克风音箱、会议转写一体机、语音跟踪摄像头、会议实时转写软件
    发表于 10-16 14:13 204次阅读
    智能家居蓬勃发展,智能<b class='flag-5'>语音</b><b class='flag-5'>技术</b>日趋关键

    语音识别技术的应用及优化

    一、引言 语音识别技术是一种能够让计算机“听懂”人类语言的技术。随着科技的不断发展,语音识别技术的应用范围越来越广泛。本文将探讨
    的头像 发表于 10-10 17:26 1015次阅读

    语音识别技术的现状及发展趋势

    一、引言 随着科技的快速发展,语音识别技术得到了广泛应用。语音识别技术是一种人机交互的关键技术,它使得计算机能理解和
    的头像 发表于 09-28 16:55 1955次阅读

    语音识别技术:原理、应用与未来

    一、引言 语音识别技术是一种让计算机理解和解析人类语音的方法。这种技术已经存在多年,但随着硬件性能的提升和深度学习算法的发展,
    的头像 发表于 09-19 18:30 1190次阅读

    工业互联网中的标识解析技术

    工业互联网的核心是数据的价值发现问题,但由于历史原因,“信息孤岛”现象在企业内部、企业之间大量存在。标识解析技术是目前可见解决“信息孤岛”、完成工业大数据汇聚以及在此基础上形成信息融合理解的关键技术。分析了标识
    发表于 09-19 06:07

    语音合成技术的应用与挑战

    语音合成技术是一种通过计算机技术生成人类可听的语音技术,它已经广泛应用于各个领域。本文将介绍语音
    的头像 发表于 09-16 14:46 730次阅读

    TTS语音合成技术及其应用

    TTS语音合成技术是一种将文本转换为自然语音技术,它利用计算机技术和人工智能技术来模拟人声的发
    的头像 发表于 06-24 02:28 845次阅读

    语音识别技术的概念及应用前景

    智能语音技术是人工智能应用最成熟的技术之一,并拥有交互的自然性,就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的
    发表于 05-27 09:41