Alexa：训练TTS模型多扬声器数据比单扬声器更适合

时间：2019-04-27

【CNMO新闻】随着自然语言处理系统的性能日益出色，语音转文字（TTS）系统也正变得愈发高效，但是训练这些TTS模型的方法有一个缺点，那就是它们相较传统方法需要更多的数据。亚马逊Alexa部门科学家的最新研究表明，与单扬声器相比，用多扬声器的声音数据训练而成的AI TTS系统能够生成更加自然的语音，并且后者的整体表现更稳定、所需的声音数据更少。

Alexa Alexa

Lachowicz解释道，神经TTS模型通常由两部分组成，其中一部分负责将文字转化为声谱图，另一部分为将声谱图转化为声音信号的语音编码器。Lachowicz和同事使用七个不同扬声器的声音数据训练这些系统，并用独热向量编码将单个样本和扬声器联系起来。

在实验中，70位参与者聆听了人类朗读者的录音和用同一朗读者的声音训练出的两种TTS模型生成的录音，结果显示用多扬声器TTS模型的表现要优于单扬声器模型。更重要的是，科学家们没有观察到用两种性别人类朗读者的语音和单一性别人类朗读者的语音训练出的模型间存在自然性方面的统计学差异。

Lachowicz指出多扬声器模组所需的训练样本仅为单扬声器模组的三分之一，“这项研究让开发者可以生成定制化程度非常高的语音风格，而无需人类朗读者花费数天时间录制样本。”

上一篇：一加7 Pro正面到底长什么样？这下大家终于弄明白了

下一篇：AWS设立中国香港数据中心将与谷歌/微软同台竞技

揭秘中国载人航天“神箭”（筑梦“太空之家”——中国空间站建设记⑤）
如今，中国载人航天已圆满完成第一步、第二步的既定任务，正向着建造空间站、建成国家太空实验室的第三步目标前进。...
Time2021-06-24
“太空快递” 稳稳送达天舟二号货运飞船和空间站核心舱精准交会对接
5月29日20时55分，在经历了推迟发射的波折后，长征七号遥三运载火箭从位于海南的文昌航天发射场准时点火升空，将天舟二号货运飞船准确送入预定轨道，发射取得圆满成功。...
Time2021-05-31
三封贺电定义中国航天新高度
开展深空探测、建设与运营空间站、建设与运营全球卫星导航星座系统都是中国航天“旗舰”工程，也被认为是世界航天强国的“三大标配”，是对国家科技实力和综合国力的极大考验。...
Time2021-05-24
“天眼”为何受到全球热切关注？
世界最大的单口径射电望远镜，能刺穿“光年之外”，能洞悉宇宙“前世”……“中国天眼”开放运行第一年，成果即入选《自然》十大科学发现。...
Time2021-02-05
她18岁当上淘宝中老年模特，如今火到国际大牌“求合作”
最近，时尚圈都在热议一个营销事件：国际知名设计师品牌alexanderwang，找到了专拍淘宝中老年女装的模特梁晓晴拍摄新品展示视频。...
Time2022-04-22
游戏魔改历史岳飞并非首个“中招”者
近日，大热的古风模拟经营类手游《江南百景图》中出现了歪曲历史的现象：将游戏角色岳飞“魔改（指对某项作品的大幅度改造）”为“肉袒牵羊”的投降者形象。...
Time2021-08-16
涉黄诱导支付一年欺诈7个亿违法APP源码公开销售
涉黄诱导支付平台通过短色情视频吸引用户充值会员，甚至重复充值，一年欺诈近7亿。就这么一类涉黄和欺诈双违法的APP，其源码竟在网络上公开叫卖。...
Time2017-05-24
11岁男孩玩网游刷卡近3万元未成年人充值能否归还？
智能手机、网络游戏的强强联合，日渐深入小学生的生活，而网络游戏监管的空白，让众多家长受到经济损失的同时束手无策。...
Time2017-05-23

Alexa：训练TTS模型 多扬声器数据比单扬声器更适合

Alexa：训练TTS模型多扬声器数据比单扬声器更适合