Google Lens是谷歌AI支持的分析工具,现在可以从谷歌的零售和价格比较门户及谷歌商店中识别超过10亿产品。这是它在2017年10月首次亮相时所覆盖物体镜头数量的四倍。谷歌Lens和增强现实副总裁Aparna Chennapragada在一篇关于谷歌Lens里程碑的回顾性博客文章中透露了这一消息。
她写道:“过去10年,我一直在领导团队,通过搜索、助理和现在的谷歌镜头,开发利用人工智能帮助人们日常生活的产品。”每一个时刻,我们依靠其视觉来理解我们周围的环境,记住各种各样的信息,并探索我们周围的世界。”
在这里,产品是指产品标签。谷歌镜头利用光学字符识别引擎,结合人工智能系统,识别不同的字符、语言和字体,加上从谷歌搜索借来的语言和拼写纠正模型,以匹配条形码、二维码、ISBN号码和其它字母数字标识符,和购物目录产品清单。
“现在,风格更难用语言表达。”Chennapragada解释道:“这就是为什么我们认为相机的视觉输入可以在这里强大,镜头可以显示有用的信息,如产品评论。”
Google Lens
当然,并非所有的谷歌镜头计算机视觉算法都能识别。这个不断增加的名单包括家具、服装、书籍、电影、音乐专辑、电子游戏、地标、名胜、着名建筑、Wi-Fi网络名称和密码、鲜花、宠物、电子游戏、饮料、名人等等。Lens会阅读并提示你用菜单和标牌上的文字,当你指着衣服或家居装饰时,它会推荐风格相似的商品。此外,也许最有用的是,它可以自动从名片中提取电话号码、日期和地址,并将它们添加到联系人列表中。
谷歌镜头在过去的一年里发生了巨大的变化。根据Chennapragada的说法,通过谷歌开源TensorFlow机器学习框架输入的标记图像进行训练的Lens,正开始更可靠地识别物体,这要归功于那些看起来像是用智能手机摄像头拍摄的照片的数据集。
它也在以更明显的方式改进。早在今年5月的I/O主题演讲上,谷歌就揭开了镜头实时分析模式的面纱。实时分析模式将识别点叠加在实时相机馈送中的可操作元素上。Lens最近开始在网上搜索谷歌图像。最近,谷歌通过谷歌应用程序将Lens引入iOS,并在Android和iOS平台上发布了一款重新设计的体验。
“至于Lens的未来,Chennapragada在人工智能驱动的增强上押下了重注。展望未来,我相信我们正在进入一个计算的新阶段,相机时代。”她写道:”在人工智能和机器学习方面,所有这些技术同时取得了惊人的进步;由于移动电话的规模,更便宜、更强大的硬件;数以十亿计的人用他们的相机记录生活中的大大小小的瞬间。”