实现步骤
Step1:成为百度AI开放平台的开发者
我们有账号之后登录,并且点击此处(百度语音)创建一个应用,如下图
然后就能看到创建完的应用和 APPID、API KEY 以及 Secret KEY了
Step2:准备数据
语音合成是将文本转换为可以播放的音频文件的服务,我们从大姚的订单库中找一段订单信息的文本如下:
三分钟前,由北京市顺义区二经路与二纬路交汇处北侧,北京首都国际机场T3航站楼 去往 东城区北三环东路36号喜来登大酒店(北京金隅店)
Step3: 编写一个语音合成示例程序
有 第一步 的 API KEY 以及 Secret KEY,以及 第二步 的数据,我们就可以写一个示例代码调用百度AI开放平台的文字识别能力
准备开发环境
小帅选择用 Java来快速搭建一个原型,关于如何安装Java。可以参考百度经验哦~。百度AI有很完善的API文档、和封装调用更方便的工具包。接下来小帅就用Maven搭建工程环境
pom.xml配置如下:
编写代码
粘贴以下内容,不要忘记替换你的 APPID APIKEY 以及 SECRETKEY 和 图片文件
运行main方法即可
保存接口返回语音byte[] 转存为MP3格式文件。这里说明一下默认返回就是MP3格式的数据哦。如果想要其他格式
点击访问合成的示例MP3文件 https://www.ydxiaoshuai.cn/demo.mp3
语音合成 单例加载。10次测试耗时如下(单位:ms(毫秒))。第一次需要加载一次AUTH。耗时多了一些。后续基本都持平在710ms以内
系统配置-小帅认为速度和配置 带宽都存在一定的因素
接下来。咱们就拿语音合成的服务。来结合实际业务做一个小的功能哦~
会员到访语音提醒搞起来
会员信息采集
下拉框
后端会员人脸信息处理
会员到访定制提示音频合成定时任务
添加一条定时任务
会员音频提示文件生成
会员到访APP推送
视频录屏APP推送会员到访并播放会员专属语音