0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过Capturer接口实现录音变速功能的方法

OpenAtom OpenHarmony 来源:OpenAtom OpenHarmony 作者:OpenAtom OpenHarmony 2022-08-18 15:32 次阅读

简介

OpenAtom OpenHarmony(以下简称“OpenHarmony”)是由开放原子开源基金会孵化及运营的开源项目,是面向全场景、全连接、全智能时代的智能物联网操作系统

多媒体子系统是OpenHarmony系统中的核心子系统,为系统提供了相机、音频视频等多媒体功能。多媒体子系统的音频模块、音频录音功能可以提供两套接口,一是由ohos.multimedia.media提供的AudioRecorder接口,能够直接设置录音保存的文件路径,在录制结束以后自动生成对应的录音文件,代码编写比较简单;二是由ohos.multimedia.audio提供的AudioCapturer接口,能够获得录音过程中的PCM数据,并对数据进行处理。由于Capturer接口对于原始数据的处理更加灵活,今天就和大家介绍通过Capturer接口实现录音变速的功能的方法。

效果展示

通过Capturer接口实现音频的录制,在录制过程中对PCM数据进行重采样实现声音的快放和慢放。

详细效果请看下方视频:

首先设置录音加速或者录音减速,设置完成以后点击“录音开始”按钮进行录音,点击“录音结束”按钮停止录音,再通过点击“播放开始”对录音的音频进行播放,播放的音频是设置后的加速或者减速效果。

代码已经上传至SIG仓库,链接如下:

https://gitee.com/openharmony-sig/knowledge_demo_entainment/tree/master/FA/AudioChangeDemo

目录结构

803b51c0-1ea7-11ed-ba43-dac502259ad0.png

调用流程

1.Start的框架层调用流程

80544d6a-1ea7-11ed-ba43-dac502259ad0.png

2. Read的框架层调用流程

805f634e-1ea7-11ed-ba43-dac502259ad0.png

源码分析

1.首先看一下页面的布局,主要分为四个模块:(1)设置录音加速


	
设置录音加速:
1.25倍速1.5倍速
1.75倍速2倍速

(2)设置录音减速


	
设置录音减速:
0.75倍速0.5倍速

(3)录音


	
录音:
录音开始录音结束

(4)播放


	
播放:
播放开始播放结束
class="video" src="{{url}}" autoplay="{{ autoplay }}" controls="{{ controlShow }}" muted="false" onseeked="seeked" onprepared="prepared" >

2.逻辑代码在JS中:

(1)首先通过AudioCapturer接口获取到PCM数据,再通过调用AudioCapturer的start接口来启动录音流程。

globalThis.capturer.start().then(function () {    console.log("gyf start");    globalThis.capturer.getBufferSize((err, bufferSize) => {        if (err) {            console.error('gyf getBufferSize error');        } else {            console.log("gyf bufferSize = " + bufferSize);            globalThis.getBuf(bufferSize);        }    });});

(2)启动成功以后,getBuf会调用到getData函数,getData函数通过AudioCapturer的read方法来读取数据,成功读取到数据以后,通过handleBuffer函数对数据进行处理。handleBuffer函数的参数arrayBuffer就是通过read方法读取出来的pcm数据,在handleBuffer中对数据进行了快速播放或者慢速播放的处理。

//循环调用read,进行数据的读取handleBuffer(arrayBuffer) {    console.log("gyf handleBuffer");
    let result = new Uint8Array(arrayBuffer);    console.log("gyf handleBuffer ================== " + result);
    let outData = this.test(result, up, down);
    fileio.writeSync(globalThis.fd, outData.buffer);
    globalThis.capturer.read(globalThis.bufSize, true).then(this.handleBuffer);},
getData(bufSize) {    console.log("gyf getData");    globalThis.capturer.read(bufSize, true).then(this.handleBuffer);},
getBuf(bufSize) {    console.log("gyf getBuf");    this.getData(bufSize);},

(3)快速播放或者慢速播放是通过up和down两个方法的组合来实现的,down方法的原理是对PCM数据进行插值处理,在相邻两点间插入down个采样点,up方法的原理是间隔抽取,间隔up个点进行抽取采样。

up(data, up) {    if (1 == up) {        return data;    }    let length = data.byteLength;    let upLength = Math.round(length / up);    var upData = new Uint8Array(upLength);    for (var i = 0, j = 0; i < length; ) {        if (j >= upLength) {            break;        }        upData[j] = data[i];        i += up;        j++;    }    return upData;},
down(data, down) {    if (1 == down) {        return data;    }
    let length = data.byteLength;    let downLength = Math.round(length * down);    var downData = new Uint8Array(downLength);    for (var i = 0, j = 0; i < length - 1; ) {        for (var k = 0; k < down; k++) {            downData[j] = data[i];            j++;        }        i++;    }    return downData;},

(4)将down和up的方法组合调用,来实现1.25倍、1.5倍、1.75倍、2倍、0.75倍、0.5倍的速度播放。

test(data, up, down) {    let downData = this.down(data, down);    let upData = this.up(downData, up);    return upData;},

(5)播放wav格式的音频文件,采集获取PCM数据,需要我们根据设置的参数对pcm数据进行添加wav的头部信息,通过创建AudioCapturer实例的时候设置采集音频的参数,如采样率、通道数、采样格式等。

//音频采集初始化var audioStreamInfo = {    samplingRate: audio.AudioSamplingRate.SAMPLE_RATE_8000,    channels: audio.AudioChannel.CHANNEL_1,    sampleFormat: audio.AudioSampleFormat.SAMPLE_FORMAT_U8,    encodingType: audio.AudioEncodingType.ENCODING_TYPE_RAW}
var audioCapturerInfo = {    source: audio.SourceType.SOURCE_TYPE_MIC,    capturerFlags: 1}
var audioCapturerOptions = {    streamInfo: audioStreamInfo,    capturerInfo: audioCapturerInfo}let that = this;
audio.createAudioCapturer(audioCapturerOptions,(err, data) => {    if (err) {        console.error(`gyf AudioCapturer Created : Error: ${err.message}`);    }    else {        console.info('gyf AudioCapturer Created : Success : SUCCESS');        that.capturer = data;    }});

(6)根据这些参数设置的信息需要对wav文件写入文件头,头信息一般包含44个字节,里面需要设置三个chunk的信息(RIFF chunk、fmt chunk、data chunk),具体的信息可以查看官网的介绍WAV文件格式介绍(http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html)。

//假设数据为1000秒钟的时间(8000 * 1000)encodeWAV() {    var dataLen = 8000000;    var sampleRate = 8000;    var sampleBits = 8;    var buffer = new ArrayBuffer(44);    var data = new DataView(buffer);
    var channelCount = 1;   // 单声道    var offset = 0;
    // 资源交换文件标识符    this.writeString(data, offset, 'RIFF'); offset += 4;    // 下个地址开始到文件尾总字节数,即文件大小-8    data.setUint32(offset, 36 + dataLen, true); offset += 4;    // WAV文件标志    this.writeString(data, offset, 'WAVE'); offset += 4;    // 波形格式标志    this.writeString(data, offset, 'fmt '); offset += 4;    // 过滤字节,一般为 0x10 = 16    data.setUint32(offset, 16, true); offset += 4;    // 格式类别 (PCM形式采样数据)    data.setUint16(offset, 1, true); offset += 2;    // 通道数    data.setUint16(offset, channelCount, true); offset += 2;    // 采样率,每秒样本数,表示每个通道的播放速度    data.setUint32(offset, sampleRate, true); offset += 4;    // 波形数据传输率 (每秒平均字节数) 单声道×每秒数据位数×每样本数据位/8    data.setUint32(offset, channelCount * sampleRate * (sampleBits / 8), true); offset += 4;    // 快数据调整数 采样一次占用字节数 单声道×每样本的数据位数/8    data.setUint16(offset, channelCount * (sampleBits / 8), true); offset += 2;    // 每样本数据位数    data.setUint16(offset, sampleBits, true); offset += 2;    // 数据标识符    this.writeString(data, offset, 'data'); offset += 4;    // 采样数据总数,即数据总大小-44    data.setUint32(offset, dataLen, true); offset += 4;
    return data;},

总结

本文介绍了通过使用OpenHarmony音频模块的AudioCapturer接口实现录音功能。AudioCapturer接口对于原始数据的处理非常灵活,能够对采集的数据进行插值/抽值的重采样处理,并将处理后的音频处理保存至本地文件。由于本地文件使用的是WAV格式,故在写数据前需要对WAV文件进行头部信息的添加,这些信息可以根据创建AudioCapturer时设置的参数来进行设置,以此保证头部信息的准确性,最后再通过应用层的video组件对音频数据进行播放。

希望这篇文章能为开发者提供一些新的思路,从而进行其他场景的拓展,例如将获取到采集的数据通过这种方式实现语音识别、语音转写等功能,在实践开发的过程中为OpenHarmony生态的发展贡献一份力量。

审核编辑:汤梓红


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 接口
    +关注

    关注

    33

    文章

    7639

    浏览量

    148485
  • 音频模块
    +关注

    关注

    1

    文章

    135

    浏览量

    12183
  • OpenHarmony
    +关注

    关注

    23

    文章

    3286

    浏览量

    15159

原文标题:如何通过OpenHarmony的音频模块实现录音变速功能?

文章出处:【微信号:gh_e4f28cfa3159,微信公众号:OpenAtom OpenHarmony】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    鸿蒙开发实战项目:录音变声应用

    没有设置,默认是正常录音的速度,设置完成以后点击开始录音,启动录音功能,点击录音结束后,停止录音
    发表于 03-01 17:24

    请问如何通过hdmi接口实现控制单反拍照及录像

    如何通过hdmi接口实现控制单反拍照及录像,这个功能如何实现?对于多个单反可以同时控制又是如何实现呢?我想
    发表于 02-19 01:08

    怎样使用IWeb接口实现HTTPS的功能

    的应用程序中都保留副本。手持设备仅包含常用根证书的一小部分,从而防止占用过多的空间。SSL的实现有两种方法,一种是面向socket的实现,另一种是面向http的实现及HTTPS。这里
    发表于 08-05 06:52

    STM32通过口实现双机通信的方法是什么

    STM32通过口实现双机通信的方法是什么
    发表于 12-16 06:27

    怎样使用STM32F103的SPI或IIC接口实现显示功能

    OLED屏显和汉字点阵编码原理是什么?怎样使用STM32F103的SPI或IIC接口实现显示功能呢?
    发表于 01-21 06:39

    esp32能否通过AT接口实现modbusTCP slaver的功能

    的可行性:方法一 :1 针对esp32的源码工程添加ModbusTCP工程,4种寄存器的起始地址和数量通过AT指令参数实现。2 设计对应的自定义AT接口,包括配置的IP地址端口,超时时
    发表于 05-23 09:34

    如何通过OpenHarmony的音频模块实现录音变速功能

    录音变速功能方法。效果展示通过Capturer接口实现音频的录制,在录制过程中对PCM数据进
    发表于 08-25 11:45

    小波变换在语音变速上的应用

    小波变换在语音变速上的应用:对语音生成及其特征进行描述, 提出了一种基于保持音调前提下的语音变速方法L利用基频估值可以得到语音的基音周期, 适当地复制或删除若干个基音
    发表于 10-25 12:21 10次下载

    基于FPGA的VGA接口实现和字符显示

    基于FPGA的VGA接口实现和字符显示论文
    发表于 10-29 17:18 8次下载

    如何通过STM32的串口实现简易脱机编程器

    如何通过STM32的串口实现简易脱机编程器如何通过STM32的串口实现简易脱机编程器如何通过STM32的串
    发表于 04-25 09:38 59次下载

    ARM与FPGA的接口实现的解析

    ARM与FPGA的接口实现的解析(应广单片机)-该文档为ARM与FPGA的接口实现的解析详述资料,讲解的还不错,感兴趣的可以下载看看…………………………
    发表于 07-22 09:47 14次下载
    ARM与FPGA的<b class='flag-5'>接口实现</b>的解析

    C#-Interface接口实现

    C#-Interface接口实现(安徽理士电源技术有限公司招聘信息)-该文档为C#-Interface接口实现讲解文档,是一份还算不错的参考文档,感兴趣的可以下载看看,,,,,,,,,,,,,,,,,,
    发表于 09-28 09:42 3次下载
    C#-Interface<b class='flag-5'>接口实现</b>

    通过标准的CAN接口实现的测试台自动化解决方案

    通过标准的CAN接口实现的测试台自动化解决方案
    的头像 发表于 10-11 14:17 1256次阅读

    基于XML语言描述的接口实现方法

    电子发烧友网站提供《基于XML语言描述的接口实现方法.pdf》资料免费下载
    发表于 11-06 10:39 0次下载
    基于XML语言描述的<b class='flag-5'>接口实现</b><b class='flag-5'>方法</b>

    RK3399 Ubuntu通过Python实现录音和播放功能

    本文基于IDO-SBC3968Ubuntu系统通过Python脚本实现录音和播放功能。IDO-SBC3968采用RK3399国产六核64位CPU高性能处理器,支持4KHDMI2.0显示
    的头像 发表于 11-25 08:32 271次阅读
    RK3399 Ubuntu<b class='flag-5'>通过</b>Python<b class='flag-5'>实现</b><b class='flag-5'>录音</b>和播放<b class='flag-5'>功能</b>