……接上文Part 1(点击此处开始阅读)
懂零售
一套设计方案中,算法、硬件、 场景互相适配,构成一个完整的三角形。方案设计得是否符合“商业的逻辑”,很大程度上取决于对零售的理解程度。
零售是创新工场AI工程院今年的主打行业,联合创始人王晶表示,人工智能团队当中要有行业专家,每次见客户最长的时间花在了解对方的实际业务上。
刘凯告诉亿邦动力网,不同类型的零售商间差异会比较大,但即便同一类型的零售商客户,在管理上的需求也存在很大差异。
“做家居的客户会希望我们能按家庭的维度去识别客户,而卖日用品的客户可能更急迫于知道有哪些人是回头客。在同类的零售商中,根据客户自身管理目标的不同,共性的需求也会在指标要求上有差异,如对准确率、召回率的要求有所不同,差异化的个性化需求,未必在整个行业间通用。”刘凯说。
王晶认为,方案的优劣不仅取决于算法,很多时候是工程上的问题。“比如,要从用户的整个流程体验的角度考虑,怎样有一个很好的结账流程,让用户感觉更顺畅,反之不管技术多炫酷,如果用户不舒服,商家都不会买单的。”
深兰在克制技术的无限延展。“柜子可以只装四个摄像头或者六个摄像头,摄像头多了,GPU算力需求比较大,成本高。基本上你故意要偷也能偷走,但是问题是大多数人正常购买,而且如果货少了,我们调取视频也会发现,还和其他公司共享信用,偷窃查出来后就上黑名单了。”陈海波介绍。
即便Amazon Go也有针对零售场景而变通的一面。其货架使用的重力感应器其实存有隐患,理论上,小偷可以快速把商品替换成其他东西(比如一袋沙子)而不被发现,不过考虑到这是多人同在的场景,类似的偷盗实施起来比较困难也就忽略了。
林捷总结出来一套经验:不要让技术花时间在运营能够解决的问题上。
“几十个人挤在柜台前结账,这样的场景就不要让视觉科学家去研究了,机器分不清楚谁买了什么,就让顾客排队好了。”
这些取舍建立在零售业的理解上,技术大咖补课不足就容易掉坑。
“有的(方案)为了做到更好的商品识别效果,会加高货架的层高,降低层数,一般货架有5到6层,变成了4层。”林捷强调,这是损伤便利店平效的本末倒置,“如果了解零售,绝对不会在技术设计上牺牲平效的。”
商品识别方兴未艾
要实现对人货关系互动的记录以及无人结算,绕不开谈商品识别。这也是视觉科学家在争夺的新高地,“前几年我们刷榜刷的都是人脸,刷烂了,现在物体是最难的。”一位业内人士透露。
去年,旷视参加了COCO竞赛的物体检测、人体关键点和物体分割三个单项比赛,获得两个第一和一个第二。码隆科技取得了WebVision竞赛的第一名。
相比人脸识别,商品识别还徘徊在起跑线上。传统商超、便利店和品牌店升级改造,都一般采用条形码、RFID这些“老古董”技术,即便缤果盒子这样的创新项目也启用了RFID。
“因为RFID是一个比较偏成熟的方案,最早选择它在创业上是make sense(说得通)的。图像识别技术可能更领先、挑战更大。”华映资本投资总监姜志峰说。
总得来说,人脸相对标准化,可以把人种作为单独训练模型,而零售涉及的商品SKU多而杂,每个类别单独训练难度大,不可控性更高。机器识别每张照片的基本逻辑是:每张照片有向量,即多组数字,某几个组合起来代表袖长、颜色、款式等特征,机器根据数字判断自己“看见”的是啥。但是,如衣服这种柔性物体易变形,不同穿法或者扭曲、折叠在图片中像素排列不同,让计算机明白它们是同一件的不同形态很难。
此外,现在人脸识别已经可以把算法做到手机里,比如刷脸解锁,而物体识别暂时还要基于GPU或者X86这种高性能的硬件架构,成本较高。
“WebVision竞赛上李飞飞给我们颁的奖。”码隆创始人黄鼎龙强调。
和旷视不一样,物体识别是码隆们安身立命的根本。此外,国内市场上头部玩家还有衣+、Visenze。
与人脸识别早早收割了安防的麦田不同,商品识别长时间以来被认为应用场景不明确,空有技术难变现,玩家们在漫长的商业化探索中走出了不同的万里长征。
三家业务都在电商上下了大力气。码隆和衣+最初做的都是以以图搜图为核心的to C产品,类似淘宝“拍立搜”,后来转向2B服务,一个建立了Product AI平台,将识别能力开放给电商平台、品牌、图库等商家;另一个则锁定了媒体和大屏等,比如,在优酷视频上即看即买,跳转进入淘宝购物,即通过衣+的技术实现。
“线上的调用量在缓慢增长。”黄鼎龙说,从码隆的经验拉里看,线上市场有需求,但不会迅速爆发。为更快打开市场,码隆还把精力投向商家后端,比如,利用图像识别技术实现一键生成产品详情页功能。
黄鼎龙认为,经过几年的数据积累和算法迭代,加之新零售风潮愈来愈热闹,商品识别应用于线下的机会到了。
“这个事情能不能成立取决于是否useable(可用的)和useful(有用的),一方面,在技术上要达到基本可用的状态,这是很重要的前提条件,别人试了不work就不行;另一方面,也得有用,17年随着零售领域的(兴起),大家开始觉得有用。“黄鼎龙说。
Yi+也在向线下零售进发,无人店和快消品品牌是其目前主要客户群体。“我们的数据积累,和客户建立起的反馈机制,都是难以短时间跨越壁垒。”Yi+产品负责人说。
不过,Visenze的兴趣还不大,它总部在新加坡,主要为海外客户提供以图搜图技术,例如乐天、H&M等。
CTO李广达认为,计算机视觉技术还没有达到大范围应用于实体零售的程度。“计算机视觉有mission critical(关键任务)和非mission critical两种场景,区别在于效果的可信度。摄像头解决方案可以一定程度上提升效率,但是有些场景还不能完全信任。”
他认为,电商环境的以图搜图是典型的非mission critical场景。尽管当涉及到一些细节属性,比如颜色、领子类型、袖子长短等等,准确度会打折扣,但这可以慢慢打磨。
大而无当还是前途无量?
商品识别是不是真的“useful”,即能否商业化、是否值得研究尚存争议。
图普科技和商汤暂时都还未涉及。“厂商对这方面热情还比较高,但可能需求不够聚焦,如何深度结合实际业务还需要探讨。”刘凯说。
(使用RFID的CITYBOX)
“商品的识别有一些创业公司在做,术业有专攻,市场这么大,我们做好自己的事情就好了。我个人判断它(机器视觉识别商品)的价值意义没那么大。”尚海龙介绍称,苏宁Biu店卖球鞋、运动衣,感应电子标签(RFID)即可结账。
RFID在服装行业尤其受到欢迎。“视觉技术可能在某些产品上取代RFID,服装可能比较难。“马克华菲CIO兼任电商总经理左敬东说。
马克华菲有100多家智慧门店,商品配置RFID标签,通过物联网识别器,消费者试穿衣服时站到智能试衣镜前,大屏可自动识别商品ID,向消费者展示模特试穿效果、产品介绍、评价、相关搭配等内容。
除了前端展示,RFID在后端零售库存管理上优势明显。“正常门店进行库存盘点,3000件衣服,2个人,原来需要半天到1天时间。利用RFID芯片,用扫描枪片式感应进行群读扫描,1个人,仅需15分钟就能完成全部盘点。”茵曼母公司汇美CMO肖海坤表示。
不过,RFID也有未解决的难题:每件商品都要加贴至少三四毛钱的标签,人工和材料成本高,且遇金属和液体等不识别或效果差。
除了机器视觉和RFID,市面上的还有消费者自己拿商品扫码结账、重力感应等方案。
(分别为物美超市的自助收银台)
“扫码对商户来说成本低且简单,但建立在信用基础上,盗损大,且顾客自己动手影响用户体验。重力感应是老技术在零售领域的新应用,无法判断具体哪件商品,知道哪个货架被动过。”
陈海波本人是机器视觉忠实拥护者,“未来商店一定是没有营业员,商品、编码、条形码不存在,商品一定要能够被远距离非接触识别。”
不单单是未来,也有人已然找到了细分场景的即时需求。
王晶认为不能用RFID的场景也是机器视觉的机会,比如蛋糕店,“蛋糕都是用盘盛的,怎么贴标签?”还有超市的自助称重机也可以改用视觉识别,因为“在显示屏的一页页商品中区分查找蛇果和富士苹果的体验很差”。
国外还有专门从事快消品货架识别的Trax,在全球50个国家有175个客户,不乏可口可乐、百威、雀巢、汉高、百事这样的大品牌,每月处理2.5亿的SKU产品。
刚刚就任中国区负责人的王茜介绍,Trax已形成“交钥匙”式解决方案:两米多的货架只需一个成本“几美金”的摄像头,品牌商使用手机拍照即可。
最基本的,品牌商销售代表把货架照片上传至云端解析,监督门店;零售商安装固定摄像头,实时监测动态变化;也可以在冰箱上装上小小的摄像头,每开关一次拍摄一张照片,记录销售情况。Trax声称,服务的快消品公司断货率下降10%到15%,整体销售业绩提升3%到5%。
Trax核心市场在美国,今年1月正式进入中国,目标三年内中国市场年收入达到1亿美元。
用视觉技术识别货架商品在国内少见,土生土长的Yi+也打算深耕。“国内的快消公司相对传统,我们的本土优势比较明显,而且以服饰和商品识别起步,在零售方面也有优势。”销售负责人称。
他表示,货架识别在国内处于空白状态,快消品公司也有迫切需求。“它们一般需要向超市或者门店交纳进场费,获取货架数据非常关键,很关心自己的货摆得好不好,销售量好不好,每天有什么变化,之前都没办法及时统计。”
当然,蛋糕店和超市愿不愿意买创新工场的视觉方案,Trax能不能赚到1亿美元,Yi+能不能成功挖掘到本土客户,这些都将被2018年所检验。
“我们希望通过AI降本增效,如果两点都能做到的话,我们就会把它商业化落地,如果最后得出的结论是用视觉无法真的做到的话,可能就不会做类似的产品。顶多做点展示,表明我们有这个能力而已。”正在关注商品识别的计算机视觉产品经理说。