四海资讯
首页 > 科技资讯 > 手机数码

微软开发Seeing AI应用 图像转音频盲人可实现“听”图

时间:2019-03-13

【CNMO新闻】微软的Seeing AI是一款应用程序,可让盲人和有视力障碍的人将视觉数据转换为音频反馈,并且它还添加了另一个新功能,即用户可以利用触摸来浏览照片中的对象和人物。该功能使用了机器学习技术,特别是在对象和场景识别方面,用户只需要在查看器中拍照或打开照片,然后点击上面的任意位置即可。

微软微软

Seeing AI负责人Saqib Shaikh在博客文章中写道:“这一新功能让用户可以通过手指触摸屏幕上的图像,就可以获取对象的描述以及它们之间的空间关系。该应用程序甚至可以描述人们的外表,并且预测他们的心情。”

因为该应用程序内置了面部识别技术,用户可以拍摄其朋友的照片,然后听听他们在做什么、在哪里以及图片中是否有狗等等。

但该应用程序现在允许用户点击以查找对象的位置,显然对于理解图片或从之前的图片中进行识别非常重要。一些在整体描述中没有出现的细节也可能会在仔细检查时出现,例如前景中的鲜花或背景中的电影海报。

除此之外,该应用程序现在原生支持iPad,对于那些使用苹果平板电脑作为媒体和交互主要界面的人来说,这肯定是一件非常好的事情。最后,界面有一些改进,因此用户可以根据自己的喜好在应用中订购。

  • 上一篇:特斯拉内外忧患不得“员工心” 抛弃员工试图削减成本
  • 下一篇:握手言和!苹果公司与昔日对手Roku player达成合作