未来的Alexa合成音效让声音变得更好听

时间：2018-11-20

你是否已经厌倦了Alexa那古板乏味的腔调? 多亏了新的人工智能技术，亚马逊也许很快就能让语音助手掌握新的讲话风格。在最新发布的论文和博客中，亚马逊提供了更多关于Alexa可以学习新的讲话风格的文本语音转化系统的细节。

“对用户来说，神经网络生成的合成语音听上去比由语音数据库中的片段拼接而成的结果更自然，”亚马逊学术理事Trevor Wood写道。“得益于我们系统的灵活性，我们可以很容易地改变合成语音的讲话风格。”

图片来自亚马逊

这个亚马逊的神经网络语音文字转化系统包含了两个组件。第一个是将音素顺序转换为更加直观地展现声音变化的声谱，另一个是把声谱转化为连续声音信号的语音编码器。音素声谱转化系统是序列对序列的，也就是说它并不只是从对应的输入量中计算出输出量而不考虑输出序列。亚马逊的科学家用音素序列和声谱序列训练它，并配合以能够识别具体讲话风格的“风格编码”。

人工智能的输出量将会进入语音编码器并最终形成高质量的波形图。语音编码器可以处理任何讲话者的声谱，不管自身是否在此前的训练过程中接触过，人工智能也不需要使用讲话者编码。结果便是我们获得了由大量中性风格讲话数据以及只有几小时目标风格的补充性数据构成的模型训练方法，和一个能分辨讲话风格中独立或独有元素的人工智能系统。

图片来自亚马逊

“当面对一种讲话风格的代码时，这个网络会预测合适该风格的韵律模式并将其应用于一个独立生成的表现形式，” Wood解释道：“而借助一些额外训练数据实现的高质量标准能够引起讲话风格的快速扩张发展。”

根据亚马逊的调查，相较于传统方法拼接而成的语音，听众更喜欢由该神经网络语音声音转化系统生成的声音。Wood写道：“这种偏好反映了该系统所带来的语音质量的提升。而相关新闻播报员的声音的提高则展现了我们系统根据文本生成讲话风格的能力。”

上一篇：大众集团坦言论自动驾驶不如Waymo！

下一篇：探索AI CSIRO为澳大利亚太空提供资金

揭秘中国载人航天“神箭”（筑梦“太空之家”——中国空间站建设记⑤）
如今，中国载人航天已圆满完成第一步、第二步的既定任务，正向着建造空间站、建成国家太空实验室的第三步目标前进。...
Time2021-06-24
“太空快递” 稳稳送达天舟二号货运飞船和空间站核心舱精准交会对接
5月29日20时55分，在经历了推迟发射的波折后，长征七号遥三运载火箭从位于海南的文昌航天发射场准时点火升空，将天舟二号货运飞船准确送入预定轨道，发射取得圆满成功。...
Time2021-05-31
三封贺电定义中国航天新高度
开展深空探测、建设与运营空间站、建设与运营全球卫星导航星座系统都是中国航天“旗舰”工程，也被认为是世界航天强国的“三大标配”，是对国家科技实力和综合国力的极大考验。...
Time2021-05-24
“天眼”为何受到全球热切关注？
世界最大的单口径射电望远镜，能刺穿“光年之外”，能洞悉宇宙“前世”……“中国天眼”开放运行第一年，成果即入选《自然》十大科学发现。...
Time2021-02-05
她18岁当上淘宝中老年模特，如今火到国际大牌“求合作”
最近，时尚圈都在热议一个营销事件：国际知名设计师品牌alexanderwang，找到了专拍淘宝中老年女装的模特梁晓晴拍摄新品展示视频。...
Time2022-04-22
游戏魔改历史岳飞并非首个“中招”者
近日，大热的古风模拟经营类手游《江南百景图》中出现了歪曲历史的现象：将游戏角色岳飞“魔改（指对某项作品的大幅度改造）”为“肉袒牵羊”的投降者形象。...
Time2021-08-16
涉黄诱导支付一年欺诈7个亿违法APP源码公开销售
涉黄诱导支付平台通过短色情视频吸引用户充值会员，甚至重复充值，一年欺诈近7亿。就这么一类涉黄和欺诈双违法的APP，其源码竟在网络上公开叫卖。...
Time2017-05-24
11岁男孩玩网游刷卡近3万元未成年人充值能否归还？
智能手机、网络游戏的强强联合，日渐深入小学生的生活，而网络游戏监管的空白，让众多家长受到经济损失的同时束手无策。...
Time2017-05-23