【CNMO新闻】微软的Seeing AI是一款应用程序,可让盲人和有视力障碍的人将视觉数据转换为音频反馈,并且它还添加了另一个新功能,即用户可以利用触摸来浏览照片中的对象和人物。该功能使用了机器学习技术,特别是在对象和场景识别方面,用户只需要在查看器中拍照或打开照片,然后点击上面的任意位置即可。
微软
Seeing AI负责人Saqib Shaikh在博客文章中写道:“这一新功能让用户可以通过手指触摸屏幕上的图像,就可以获取对象的描述以及它们之间的空间关系。该应用程序甚至可以描述人们的外表,并且预测他们的心情。”
因为该应用程序内置了面部识别技术,用户可以拍摄其朋友的照片,然后听听他们在做什么、在哪里以及图片中是否有狗等等。
但该应用程序现在允许用户点击以查找对象的位置,显然对于理解图片或从之前的图片中进行识别非常重要。一些在整体描述中没有出现的细节也可能会在仔细检查时出现,例如前景中的鲜花或背景中的电影海报。
除此之外,该应用程序现在原生支持iPad,对于那些使用苹果平板电脑作为媒体和交互主要界面的人来说,这肯定是一件非常好的事情。最后,界面有一些改进,因此用户可以根据自己的喜好在应用中订购。