Alexa研究者改善数据不平衡减少AI错误率15%到30%

时间：2019-03-12

【CNMO新闻】不平衡的训练数据是机器学习系统分类器需要面对的主要困难之一。当一个类别的样本数量过多时，分类器接触此类样本的次数也更多，系统也就更有可能产生偏差。

亚马逊Alexa部门的研究者表示其已经开发出了一种将数据不平衡系统的AI错误率降低最多30%的方法，并在最近发表的一篇论文中对其进行了详细解释。

亚马逊Alexa

一般情况下，数据科学家通过提高代表性不足的数据类别的重要性来解决数据样本代表性不足的问题。但是Alexa高级研究员Ming Sun找到了一种不同的方法。他和他的同事训练了一个以矢量形式为每个数据类别生成嵌入体的AI系统并将这些矢量间的距离最大化。

为了避免嵌入体中的出现数据不平衡，数据量最大的类别会被分割为体量更小的数据群。并且为了缩短系统测量数据项之间距离的时间，该系统拥有不间断进行测量的机制。

Sun在博客中解释道：“有了新的嵌入体，我们的算法可以测量系统同数据集中心的距离，与之前相比这是一种更加高效的计算方式。”

这种嵌入AI系统的输出数据被用于训练分类器，随后，研究者用四种工业级的数据集对其进行了测试，分别是狗叫声、婴儿哭声、枪声和背景声。测试结果显示AI系统的错误率下降了15%到30%。在更大、更慢但更精确的卷积神经网络参与的实验中，研究者也记录到6%至19%的错误率降幅。

上一篇：华为手环3/3 Pro曝光 AMOLED彩屏触控/支持泳姿识别

下一篇：特斯拉Model 3供不应求订单交付时间将推迟一个月

揭秘中国载人航天“神箭”（筑梦“太空之家”——中国空间站建设记⑤）
如今，中国载人航天已圆满完成第一步、第二步的既定任务，正向着建造空间站、建成国家太空实验室的第三步目标前进。...
Time2021-06-24
“太空快递” 稳稳送达天舟二号货运飞船和空间站核心舱精准交会对接
5月29日20时55分，在经历了推迟发射的波折后，长征七号遥三运载火箭从位于海南的文昌航天发射场准时点火升空，将天舟二号货运飞船准确送入预定轨道，发射取得圆满成功。...
Time2021-05-31
三封贺电定义中国航天新高度
开展深空探测、建设与运营空间站、建设与运营全球卫星导航星座系统都是中国航天“旗舰”工程，也被认为是世界航天强国的“三大标配”，是对国家科技实力和综合国力的极大考验。...
Time2021-05-24
“天眼”为何受到全球热切关注？
世界最大的单口径射电望远镜，能刺穿“光年之外”，能洞悉宇宙“前世”……“中国天眼”开放运行第一年，成果即入选《自然》十大科学发现。...
Time2021-02-05
她18岁当上淘宝中老年模特，如今火到国际大牌“求合作”
最近，时尚圈都在热议一个营销事件：国际知名设计师品牌alexanderwang，找到了专拍淘宝中老年女装的模特梁晓晴拍摄新品展示视频。...
Time2022-04-22
游戏魔改历史岳飞并非首个“中招”者
近日，大热的古风模拟经营类手游《江南百景图》中出现了歪曲历史的现象：将游戏角色岳飞“魔改（指对某项作品的大幅度改造）”为“肉袒牵羊”的投降者形象。...
Time2021-08-16
涉黄诱导支付一年欺诈7个亿违法APP源码公开销售
涉黄诱导支付平台通过短色情视频吸引用户充值会员，甚至重复充值，一年欺诈近7亿。就这么一类涉黄和欺诈双违法的APP，其源码竟在网络上公开叫卖。...
Time2017-05-24
11岁男孩玩网游刷卡近3万元未成年人充值能否归还？
智能手机、网络游戏的强强联合，日渐深入小学生的生活，而网络游戏监管的空白，让众多家长受到经济损失的同时束手无策。...
Time2017-05-23

Alexa研究者改善数据不平衡 减少AI错误率15%到30%

Alexa研究者改善数据不平衡减少AI错误率15%到30%