本文来自合作媒体:新浪科技,作者:白风、大头。猎云网经授权发布。

五年前,在中国传统茶饮市场上,康师傅、立顿、香飘飘这些瓶装和速溶饮料无疑是大多数消费者心中奶茶类饮品的首选。不过如今,已大不相同。

但现在是信息爆炸的时代,新茶饮的优势会被放大,遇到的问题也会更受关注。想要做大做强,除了杜绝做出“财务造假”之类欺骗市场的行径之外,也要努力提升产品质量和服务标准,让消费者可以放心下单。这样,做出来的茶饮才更“甜”。

与瑞幸咖啡不同,消费者针对奈雪的茶进行的投诉内容主要分为两类:门店服务态度恶劣、以及饮品被冒领。

另一位网友刘飞在奈雪的茶一门店购买饮品后,饮品在店员未经核实的情况下被另一位顾客取走。在了解饮品被冒领情况过程中,店员态度恶劣、敷衍;而在后续沟通退款时,店员称“退款需报备总部,顾客需等待三个工作日”。

人们做计算机视觉研究的理想,是让机器进行理解图像。如何让它进行理解?这非常的困难,直到现在也没有人知道它怎么去进行理解。现在它能做的,只能做到认知。人们研究计算机视觉的目的是得到视觉特征,有了视觉特征后才能开展一系列工作。

瑞幸咖啡一度被称为“中国星巴克”,在消费者圈子里,其日常推出的“大额优惠券”更为人津津乐道。在使用优惠券后,瑞幸咖啡内的大多产品一般只需要几元到二十几元不等。

人类的现实世界是在一个三维空间,拿着二维图像去做识别,这远远不够。

此外,还有多位网友表示在奈雪的茶订购饮品后,饮品被冒领。

权龙教授是享誉世界的计算机视觉与图形学专家,全球最高级别的两大计算机视觉学术会议主席,是CVPR和ICCV创办30多年来极为少有的华人主席。

2020年9月5日,第三届「中国人工智能安防峰会」也将如约而至,于杭州正式启幕。

权龙教授认为,人工智能的核心是视觉,但现在的视觉仍局限在二维识别层面,未来三维视觉重建将会成为最重要的任务。

蜜雪冰城绝对是新茶饮品牌中的一个另类:在蜜雪冰城小程序上,消费者不需要花费动辄花费几十元购买高价饮品,而是仅需几块钱就可一饱口福。

蜜雪冰城:蚊子、苍蝇、蟑螂一个不少

如果有足够的数据并且能够明确定义想要的东西,CNN 的效果很好,但是它并没有智能。

还有不少消费者也遇到了这个问题。

获取深度信息的挑战很大,它本质上是一个三角测量问题。第一步需要将两幅图像或两只眼睛感知到的东西进行匹配,也就是识别。

权龙教授强调,人们要把三维场景重新捕捉,但三维重建不是最终的目的,而是要把识别加进去,所以说最终的应用肯定要把三维重建和识别融为一体。

一位武汉的网友对新浪科技表示,自己在奈雪的茶武汉群光广场店线上下单一杯饮品后,在店内等待之余又线下购买了两个欧包。“当时店里有不忙的工作人员,可是就不给我服务。”而另一位店员询问:“就只买两个面包?”之后,在自己四五次催促下,才取到餐品。

新浪科技调查发现,当下市场上几家明星茶饮品牌多多少少都存在一些问题,而不同品牌存在的主要问题又各不相同。以黑猫投诉平台上投诉最为集中的瑞幸咖啡、奈雪的茶和蜜雪冰城为例,新浪科技梳理了消费者最常见的几类问题。

计算机视觉不是一个很好定义(ill-posed)的问题,没有一个完美的答案或方法。

不过,新茶饮的优势并不能掩盖它们的问题:不同于传统瓶装饮料或速溶饮品一手交钱、一手交货,且有严格的保质、质检流程,环节简单而有保障;新茶饮从原料选取、制作、到销售乃至配送,均暴露在房间或自然环境中,因此带来的食品安全隐患、消费纠纷更为明显。

权龙同时也是知名三维重建视觉平台Altizure的创始人。权龙曾于2011年担任ICCV大会主席,也将在2022年出任CVPR大会主席。

它能识别出猫和狗,但猫和狗的分类都是人类自己定义的,人们可以把猫和狗分开,也可以把复杂的狗类动物进行聚合和分类,这些东西本质上来说并不是客观的,而是主观的。

在这样一个拥有视觉特征前提之下,计算机视觉也只有两个现实目的,一个是识别,另一个是三维重建。

就像有些人说,新茶饮不过是“新瓶装旧酒”——用新的销售渠道、方式售卖传统茶饮。传统饮品可能存在的食品安全问题,新茶饮同样难以避免。而新渠道、新方式带来的隐患,也愈加突出。

在这一轮的CNN之前,计算机视觉里面研究最多的是三维重建这样的问题,在CNN之前有非常好的人工设计的视觉特征,这些东西本质上最早都是为三维重建而设计,例如SIFT特征。

对黑猫投诉平台上针对蜜雪冰城的230条投诉进行梳理后,新浪科技发现,有31条投诉内容涉及饮品中有“虫子”、“蚊子”、“蟑螂”、“苍蝇”及“异物”;88条投诉涉及“退款”;10条投诉涉及“态度恶劣”;其余投诉则分别涉及“拒绝使用美团/饿了么优惠券”、“偷工减料”等。

瑞幸咖啡:买了抵扣券总价更贵 且无法退款

第三届「中国人工智能安防峰会 」(9月5日召开)

律师:商家须明确标注抵扣券是否可退,否则消费者可要求退款

新浪科技针对网友关注较多的“优惠券不能退款”以及饮品安全问题咨询了北京市盈科律师事务所高级股权合伙人王贝贝律师。他表示,未使用的优惠劵能否退款,本质上是一个合同问题,需要依据消费者与平台之间的约定。在有明确约定的情况下,应当按照合同约定行使。但是,若没有使用显著标志的形式提醒消费者注意,则可能涉及可撤销或条款无效的法律后果。

它们的英文单词都以“re”做前缀,说明这是一个反向的问题。

纵使CNN的特征提取能力极其强,但是不要忘记建立在 CNN 基础上的计算机视觉是单目识别,而人类是双目。

在生物世界里,双目视觉非常重要,哺乳动物都有双目视觉,而且越凶猛的食肉的动物双目重叠的区域越大,用双目获得的深度信息去主动捕捉猎物。吃草的或被吃的动物视觉单目视觉,视野很宽,只有识别而无深度,目的是被进攻时跑得快。

网友陈帅提供的截图页面显示,自己花费31元购买的券只能购买平日18元的饮品,而抵扣券购买后不能找到退款选项。

除了日常赠送的优惠券,消费者还可在瑞幸钱包中购买抵扣券。但多位消费者对新浪科技表示,买券实非明智之举。

但蜜雪冰城遇到的问题也最严重。其他新茶饮品牌服务态度差、优惠券套路甚至饮品被冒领?“这些都不是事儿,”一位网友对新浪科技表示:“我在蜜雪冰城买的饮料,还没开封就有虫,你敢信?”

联邦学习或为AI 安防的第二落脚点

为什么视觉特征如此重要?在语音识别领域,语音的特征已经定义得非常清晰——音素。

“如果平台在与消费者订立合同前未明确告知不支持退款,则是剥夺了消费者的知情权。”王贝贝律师说。

随着互联网行业以及茶饮制作、销售方式的改变,大城市的年轻消费者逐渐开始习惯在网上下单订购新鲜茶饮。消费者只需打开手机小程序,简单几步,就可坐享新鲜、美味的定制化饮品。在这种情况下,尽管一些品牌茶饮单价高达三四十元,它们还是收获了不少拥趸。

而在这之后的“识别”,只是把它放在一个没有结构的图像数据库里去搜索而已。 由此可见,现代三维视觉是由三维重建所定义。CNN诞生之前,它曾是视觉发展的主要动力源于几何,因为它的定义相对清晰。

而“若饮品中有虫子的情况属实,可由县级以上人民政府食品安全监督管理部门责令改正,给予警告;拒不改正的,处五千元以上五万元以下罚款;情节严重的,责令停产停业,直至吊销许可证。”王贝贝律师补充道。

网友“娼诳_”对新浪科技表示,自己花费44元购买两张瑞幸咖啡抵扣券后,买三杯“小火山阿华田烤奶(原价28元)”需补差价18元,即共需44+18=62元;而不使用抵扣券的情况下,该饮品每杯价格(使用瑞幸咖啡日常优惠券)17元,三杯仅需17X3=51元。

一、定位置。假如我给出一张照片,计算机视觉要知道这张照片是在什么位置拍的。 二、多目。通过多目的视差获取三维信息,识别每一个像素并进行匹配,进行三维重建。 三、语义识别。完成几何三维重建后,要对这个三维信息进行语义识别,这是重建的最终目的。

瑞幸咖啡退款问题不单存在于购买抵扣券环节。多位消费者表示,自己在瑞幸咖啡下单发现信息错误后,立即取消订单,但退款迟迟未到。不过,用户在黑猫投诉平台进行投诉后,瑞幸咖啡方面以较快的速度进行了退款。

权龙于1989年在法国INPL取得博士学位,随后在法国INRIA任职CNRS高级研究员。2001年加入香港科技大学并担任视觉计算与图像科学中心主任。

该网友认为该门店在人力充足的情况下,不仅不提供快捷的服务,还态度轻蔑、恶劣,严重影响消费体验。

人类有两只眼睛,通过两只眼睛才能得到有深度的三维信息。当然,通过一只移动的眼睛,也可以获得有深度的信息。

可以发现,消费者针对蜜雪冰城的投诉既囊括了前文中其它茶饮品牌遇到的问题,又包含了更为严重的“食品安全”问题。

但如果拿来一个图像,问它最重要的视觉特征是什么,答案并不明确。图像包含像素,但像素并不是真正的特征。像素只是一个数字化的载体,将图像进行了数字化的表述。计算机视觉的终极目标就是寻找行之有效的视觉特征。

“买了券比不买券还贵,这不坑人吗?我要求退回剩下的抵扣券,”该网友很是生气。

这里的“识别”和前面有所不同,前面提到的是有标注情况下的识别,这里的“识别”是两幅图像之间的识别,没有数据库。它不仅要识别物体,还要识别每一个像素,所以对计算量要求非常高。

国际人工智能联合会首位华人理事会主席 杨强教授

奈雪的茶:服务态度恶劣 饮品被冒领

而新浪科技测试发现,在瑞幸咖啡小程序钱包中购买抵扣券,并未发现“优惠券售出不可退”的类似标注。

在这种情况下,根据《中华人民共和国消费者权益保护法》第48条至第55条的规定,权利受侵犯的消费者可要求经营者修理、重作、更换、退货、补足商品数量、退还货款和服务费用或者赔偿损失。

现在的计算机视觉就是基于卷积神经网络而来,整个 CNN 的架构非常简单,能做的事其实也没那么多,它提取了高维的特征,然后要结合其它方法解决视觉问题。

这一轮的卷积神经网络最本质的一件事是重新定义了计算机视觉的特征。在此之前,所有的特征都是人工设计的。今天CNN学来的东西,它学到特征的维度动辄几百万,在以前没有这类网络的情况下是根本做不到的。

计算机视觉中的三维重建包含三大问题:

双目视觉对整个生物世界的等级划分是非常严格的。马的眼睛往外看,对角的部分才有可能得到一部分三维信息,但它的三维视角非常小,不像人类。鱼的眼睛也是往两边看的,它的主要视线范围是单目的,它能看到的双目视区也是非常狭窄的一部分。