0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开发者空间实践指导:基于 3 大 PaaS 主流服务轻松实现文字转换语音

jf_21561199 来源:jf_21561199 作者:jf_21561199 2024-09-13 16:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【摘要】 基于 CodeArts API 设计语音合成接口,基于 API Explorer 调试接口,并利用 CodeArts IDE 实现数据流转换为音频

案例简介

开发者将在云主机中,基于 CodeArts API 设计语音合成接口,基于 API Explorer 调试接口,并利用 CodeArts IDE 实现数据流转换为音频。在此过程中,开发者可体验 API 设计、开发、调试等全生命周期,对华为云产品 API 体系及 API 开放能力有全面了解,并最终完成应用创建,全程实践约 15 分钟。

配置开发者空间

华为云为全球开发者打造专属开发者空间,汇聚了华为优质开发资源及工具,让每一位开发者拥有一台云主机。

在华为开发者空间,每位开发者每年可享有数百小时的云主机使用时长,5GB 的云存储空间和场景化沙箱资源,以及海量的技术赋能课程与专业开发者认证内容。

点此领取:https://auth.huaweicloud.com/authui/login.html?service=https%3A%2F%2Fdeveloper.huaweicloud.com%2Fspace%2Flogin-forword.html%3FforwardUrl%3Dhttps%253A%252F%252Fdeveloper.huaweicloud.com%252Fspace%252Fhome%26module%3Dhuaweideveloper&locale=zh-cn#/login

1.进入开发者空间,点击“云主机(beta 体验)”

wKgZombj9t6Ab9WgAAGl06e6464250.png

2.点击“添加云主机”

wKgaombj9t-AEroNAACr8drEZFE152.png

3.点击“立即进入”

wKgZombj9uCAGzjRAAMfxE4xgKc605.png

4.点击“下一步”

wKgaombj9uGAC1jAAADfx25Jf5M678.png

5.继续点击“下一步”

wKgZombj9uKAShulAADLWl6c5W8519.png

6.点击“进入桌面”

wKgZombj9uOAEE6AAADgRwCS_7k005.png

7.等待机器准备进度条加载完成至 100%,预计等待 1 分钟,然后点击“打开云桌面”即可使用

wKgaombj9uSAPETcAAGs-w2fzEs589.png

wKgZombj9uWAQJyDAAK0Bb7u_yo433.png

通过 CodeArts API 设计语音合成接口

3.1 进入 CodeArts API 官网,打开左边工具栏-Firefox 网络浏览器,输入网页版体验地址并登录

https://developer.huaweicloud.com/develop/codeartsapi.html

wKgaombj9uaAcor3AAHabGkGP_w864.png

3.2 创建项目

3.2.1 登录后点击页面右上角的“创建项目”按钮

wKgZombj9ueARM6RAATDIJHdLiM744.png

wKgaombj9uiAXth7AAOC8z_oTJY727.png

3.2.2 在创建项目弹窗中输入项目名称:语音合成,并点击保存

wKgZombj9u2AKw7tAAMrPI8cQr0423.png

3.2.3 提示保存成功,点击 API 设计页签,进入到 API 设计页面

wKgaombj9u-AJKg9AAC9ERMw0tY636.png

3.3 设计接口

3.3.1 点击页面上的“新建 API 接口”卡片

wKgZombj9vCAAvvbAAC_nZOKXsg231.png

3.3.2 显示新建标签

wKgaombj9vCAPhfFAAD-QEy4bBo869.png

3.3.3输入接口的 URL:/tts

wKgZombj9vGAKWCyAAEHNaUP_V0546.png

3.3.4输入接口名称:语音合成

wKgaombj9vOAG70cAAD3TAgXRs0930.png

3.3.5下拉滚动条到请求参数区域,点击请求体“Body”页签,选择“raw”,默认选择“JSON”格式。

wKgaombj9vSAFkDMAAD4A2PFIqU550.png

3.3.6显示请求体的数据结构模板,默认根节点类型为“object”

wKgZombj9vSAdtILAAEG_ZXC-0Q955.png

3.3.7点击根节点最右侧的“+”操作

wKgaombj9vWADgeNAAERW7em5ZU293.png

3.3.8页面上在根节点下新增一条参数(可以通过滚动条左右拖动)

wKgZombj9vaAIinlAAEAO9m2DnI230.png

3.3.9将参数名 param2 修改为 text,描述 param2 修改为待合成的文本

wKgaombj9veATxU9AAEX7oyXcPs248.png

3.3.10 下拉页面,看到返回响应区域

wKgZombj9veAHn_SAADblKotHu0352.png

3.3.11 同样点击根节点最右侧的“+”操作(可以通过滚动条拖动到最右侧),在根节点下显示一条新的参数

wKgaombj9viAUJ3GAAD46776e-A257.png

3.3.12 将参数名 param2 修改为result,将描述修改为合成结果

wKgZombj9vmAYFdDAAD12RoFYwI773.png

3.3.13 点击右上角的保存按钮

wKgaombj9vmAOTleAAEJMUyC8a4038.png

3.3.14 保存成功,设计完成

wKgZombj9vqANt8KAAFf0IGPHoo238.png

通过 API Explorer 调试语音合成接口,生成 5 段数据流

4.1 语音合成(API Explorer 部分):

链接:https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts

4.1.1 生成语音格式为 wav,采样率:8000,标准女音,语速 0,音色 0

wKgZombj9vuAc7TeAAJDVFS4vl4167.png

图 1.1.1wav 标准女音

4.1.2 生成语音格式为 wav,采样率:16000,标准男声,语速 0,音色 0

wKgaombj9vyAWIA4AAJdCL7hNbI325.png

图 1..12wav 标准男音

4.1.3 生成语音格式为 mp3,采样率:8000,标准女音,语速 100,音色 100

wKgZombj9v6AUlJ-AAKNRSfy1BI166.png

图 1.1.3 mp3 标准女音

4.1.4 生成语音格式为 mp3,采样率:16000,标准男声,语速 100,音色 100

wKgaombj9v6AKG1nAAI4jrftXmA725.png

图 1.1.4 mp3 标准男声

4.1.5 生成语音格式为 pcm,采样率:16000,标准男声,语速 100,音色 100

wKgZombj9wCAFnBrAAKk8lY5jrc286.png

图 1.1.5标准男声

在开发者空间基于华为云自研 CodeArts IDE,实现数据流转换为音频的功能

5.1 实现数据流转换为音频

5.1.1 将实验用 Demo 工程上传到 CodeArts IDE

打开右侧工具栏-Firefox 网络浏览器,输入并访问 Demo 工程下载链接:

https://sandbox-expriment-files.obs.cn-north-1.myhuaweicloud.com/2601/CodeArtsProject.zip

wKgaombj9wGAP8Y5AAFXkkzY5ek867.png

对下载好的文件进行解压(目录:主文件夹/下载),右键提取到此处

wKgZombj9wOAN4fhAAGHv5Q794s138.png

打开 CodeArts IDE,左上角点击“工程”->“打开工程”,选择刚刚解压出来的文件夹,打开:

wKgaombj9wOASASMAAE4aDTV1f0649.png

预计等待 1 分钟左右的时间,工程模型同步成功:

5.1.2 在华为云控制台新增访问秘钥,配置 AK/SK

1)登录华为云控制台:https://console.huaweicloud.com/iam/?agencyId=599e2ee1492f48e9b69a0a682d435fb8®ion=cn-north-4&locale=zh-cn#/mine/accessKey

选择“我的凭证”->“访问秘钥”->新增访问秘钥

注:如果已经有 AK/SK 秘钥,不需要新增访问秘钥

wKgZombj9wWALGrhAAIKWKmulIg964.png

创建秘钥成功后点击“立即下载”,即可获得“credentials.csv”文件,里面可以查看到 AK(Access Key Id)和 SK(Secret Access Key)

2)进入工程,src/main/resources 下选择 credentials.properties,将 AK/SK 配置上

wKgaombj9wuAT5e3AAKMYHiBt7U244.png

5.1.3 将 API Explorer 上调试成功的流数据文件配置到 APIResponse.json 中

在 2.1 语音合成章节,我们在 API Explorer 完成接口的调试

https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts

最终生成“SIS_RunTts_ResponseBody_xxxxxxxxxxxxx.json”文件,打开 json 文件,复制响应体内容(如果响应体内容没有超出限制,直接点击右侧的复制按钮即可)

wKgZombj9wuACD4qAAKviuWAB3c883.png

打开工程,进入 src/main/resources 中,选择 APIResponse.json,将 json 文件的内容复制到 APIResponse.json 中。

wKgaombj9wyAZtTaAAFzjiL5Ibo086.png

5.1.4 配置 pom.xml:

在 pom.xml 中如图所示,增加如下配置:

17

17

17

wKgZombj9w2ARYdXAALLqqXY8Kc647.png

5.1.5 执行“should_return_audio_when_response_json”,生成 mps 格式音频文件:

找到 test 目录下的测试类 SisServiceTest.java,点击找到方法“should_return_audio_when_response_json()”,点击执行测试,最后可以看到目录下生成的音频文件。

wKgaombj9w2AbN8iAAKTfj1DUbw057.png

目录下生成“devkit.mps”文件,实验结束。

wKgZombj9w-ADHIFAAT-peUfao8652.png

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    2146

    浏览量

    66198
  • PaaS
    +关注

    关注

    2

    文章

    134

    浏览量

    22864
  • 云主机
    +关注

    关注

    1

    文章

    51

    浏览量

    9031
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【书籍评测活动NO.67】成为硬核Linux开发者:《Linux 设备驱动开发(第 2 版)》

    开发设备驱动和板级支持包。截至目前,Linux仍是嵌入式系统领域的主流内核,几乎广泛应用于工业界的所有领域,这主要得益于其功能强大的子系统。因此,约翰·马迪厄编写本书,向广大开发者普及驱动编程知识
    发表于 11-17 17:52

    2025开放原子开发者大会AtomGit开源实践交流分论坛即将开启

    当前,全球开源生态正持续蓬勃发展,开发者协作模式与开源创新范式也随之经历深刻变革。在此趋势下,以开发者为中心的AtomGit,创新融合“开源运营即服务”与“开源模型即服务”双引擎,构建
    的头像 发表于 11-17 16:32 703次阅读

    服务发布配置开发者服务信息

    您作为开发者的相关信息将面向元服务发布区域的用户公开,其中客服联系方式可能会提供给用户,用于咨询相关问题。 登录AppGallery Connect,点击“APP与元服务”。 选择要发布的元
    发表于 10-31 17:58

    2025开放原子开发者大会11月启幕

    开发者年度盛会即将登场!2025开放原子开发者大会将于11月21-22日,在北京北人亦创国际会展中心盛大召开。大会以“一切为了开发者”为主题,汇聚全球开源智慧——国内外优秀开发者、学术
    的头像 发表于 10-24 14:05 709次阅读

    曙光网络SugonRI开发者社区正式上线

    在人工智能与工业深度融合的大潮中,工业软件正在成为推动产业升级的关键引擎。为了让更多开发者快速掌握工业级编程技术、共享行业实践成果,曙光网络正式推出开发者社区——曙睿(SugonRI)开发者
    的头像 发表于 09-04 09:58 708次阅读

    矽速科技正式入驻 RuyiSDK 开发者社区,共建 RISC-V 开发者生态!

    开发的开源套件,致力于为RISC-V开发者提供完整、全栈、功能强大的开发工具链,涵盖编译、调试、模拟等全流程支持,并兼容市场上主流RISC-V开发
    的头像 发表于 07-10 11:00 909次阅读
    矽速科技正式入驻 RuyiSDK <b class='flag-5'>开发者</b>社区,共建 RISC-V <b class='flag-5'>开发者</b>生态!

    HDC 2025开发者主题演讲精彩回顾

    开发者解决方案升级等内容,同时多位生态伙伴分享基于HarmonyOS的最新开发实践,为开发者提供切实可行的创新思路,进一步推动鸿蒙生态的繁荣发展。会上还举行了HarmonyOS极客马拉
    的头像 发表于 07-09 11:20 1024次阅读

    怎么用labview实现语音文字

    请问怎么用labview实现语音文字
    发表于 07-01 16:27

    全志科技亮相OpenHarmony开发者大会2025

    AI Agent技术共建启动”等仪式,同时设立八大主题分论坛,邀请开源操作系统技术大咖、前沿实践专家、开发者、生态伙伴代表等嘉宾到场,共同探讨开源鸿蒙技术的未来发展、分享最前沿的开发经验。
    的头像 发表于 06-04 09:16 1941次阅读
    全志科技亮相OpenHarmony<b class='flag-5'>开发者</b>大会2025

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    源的开发资料为开发者提供了深入研究和定制语音机器人功能的基础,开发者可以根据不同的应用需求,对语音识别算法、
    发表于 05-28 11:36

    labview语音文字

    labview语音文字怎么实现,目前在论坛上找到了文字语音
    发表于 04-07 19:44

    全链路赋能游戏鸿蒙化适配,鸿蒙游戏开发者服务焕新升级

    实践,通过专家授课、案例解析与现场互动,为开发者提供从技术适配到创新玩法落地的一站式解决方案。 游戏鸿蒙化流程详解:7步轻松实现从适配到上架 活动中,华为技术团队系统阐释了游戏鸿蒙化的
    的头像 发表于 03-17 09:25 840次阅读
    全链路赋能游戏鸿蒙化适配,鸿蒙游戏<b class='flag-5'>开发者</b><b class='flag-5'>服务</b>焕新升级

    微软发布《GraphRAG实践应用白皮书》助力开发者

    近日,微软针对开发者群体,重磅推出了《GraphRAG实践应用白皮书》。该白皮书全面而深入地涵盖了知识图谱的核心内容,为开发者和企业提供了宝贵的指导和启示。 从知识图谱的基础概念出发,
    的头像 发表于 01-13 16:11 1381次阅读

    开发者的开源鸿蒙故事

    近日,在以“一切为了开发者”为主题的“2024开放原子开发者大会暨首届开源技术学术大会”上,开源鸿蒙5.0 Release版本正式发布,备受各方关注。该版本在系统完备度、分布式创新、开发者体验以及系统稳定性等方面均
    的头像 发表于 01-06 10:28 1210次阅读

    《HarmonyOS第一课》焕新升级,赋能开发者快速掌握鸿蒙应用开发

    应用集成与开发能力,能够独立完成复杂任务及拥有团队组织能力。 主题课程则聚焦前沿应用开发主题和实践,如应用UX体验标准、实时语音与文本互转、账户能力集成等应用核心功能的
    发表于 01-02 14:24