在線的語音合成技術現在已經很完善了,可以任意輸入一段文本可以在瞬間生成對應的音頻文件,而且還可以根據實際的情況調整發(fā)音人、語速、語調、男性女性等等,在現在的生活中比比皆是,比如讓人深惡痛絕的語音電話機器人。
在線的場景下語音合成很方便也很靈活,但一些特定的場景下是無法使用的,我們公司的醫(yī)療定制開發(fā)項目中的手術移動護理系統(tǒng),因為完全運行在院內的局域網絡環(huán)境中,為了保證患者的隱私是嚴謹訪問外網的,所以在這種情況下是沒辦法使用在線合成引擎的。
手術移動護理系統(tǒng)中有一個安全核查的模塊,在操作的過程中需要語音提醒操作人員當前的患者姓名及手術相關信息,經過多方查找資料查找,發(fā)現百度云提供了離線的語音合成引擎,使用的步驟分為三個步驟。
第一個步驟是引擎的初始化,采用init的方式進行初始化,初始化的過程中可以自定義語速、語調、和發(fā)音人信息,初始化的過程中需要定義離線的模式分為純在線、純離線、在線優(yōu)先、離線優(yōu)先四種方式。
第二步因為我們這里需要的是離線引擎,所以我們選擇的是純離線方式的語音合成,TTS_MODE_OFFLINE,初始化完成后,需要配置鑒權信息,因為離線引擎是收費的,通過百度后臺進行付費購買。withSn:SN,把百度提供的系列號引入進來。
最后一步就是使用離線語音引擎進行使用播放了,雖然是離線引擎,但百度要求在首次使用語音合成模塊時,需要連接下網絡,對鑒權進行加載,下載授權信息到設備中,所以需要手工連接網絡,這里我再系統(tǒng)重做了提示,首次加載后進行提醒,后續(xù)不在重復加載了,連接完成后再斷開即可。
下一篇: 移動端適配