在今天的一篇博客中,Alexa AI小组的资深应用科学家Chengwei Su详细介绍了一个系统,该系统允许负责Alexa核心领域(如书籍、电影和视频)的AI模型独立于其它领域提高准确性。这项研究将于本月晚些时候在希腊雅典举行的IEEE口语技术大会上发表。苏教授说,这项研究已经投入生产。
域模型是在不同的数据上训练的,所以不能保证它们的概率估计是一致的,他写道:”应该优先考虑70%来自音乐的估计,而不是68%来自书籍的估计,还是说,当提到Mary Poppins时,音乐模式可能有点过于自信了?”
它是这样工作的,首先,域模型根据它们的置信度得分对假设进行排序,然后根据表示输入重要性的权重值重新排序。这些权重还用于对话语进行分类。通过用户想要执行的动作和意图应该作用于的数据项,将设备类型等上下文信息考虑在内。(例如,在Fire TV上,视频领域的假设比只对声音说话的人更有优先权。)
例如,在音乐领域内,语音播放Thriller可能会调用PlayMusic意图(而不是CreateList意图),Su解释说,但是插槽分类器可能会为单词Thriller的分类分配类似的概率,例如AlbumName和SongName。
Alexa
Su和他的同事提供了特定领域的重排序模型,包括每种话语的领域分类概率、最可能的意图和插槽假设,以说明意图信心可能比领域信心更重要的情况。经过足够的训练,它学会了为领域、意图产生单独的权重。
Su说,这种方法的优点是,每个域可以在需要时更新自己的权重系统,多个域可以并行执行更新,这样效率更高。
一天前,Alexa获得了一系列新功能,包括设置基于位置的常规和提醒、通过语音请求发现和打电话给当地企业和餐馆、筛选多个电子邮件收件箱以获取重要信息等等。就在上周,亚马逊的Alexa团队推出了一个自我学习系统,它可以检测Alexa理解上的缺陷,并自动从这些错误中恢复,而不需要人工干预,以及一个对话驱动的音乐播放列表功能,允许用户通过语音找到新的播放列表。
上周,亚马逊推出了Alexa Answers,这一功能可以让客户通过提交可能分发给全球数百万Alexa用户的答案来解决不常见的问题。