第05版:产业

“人脸问题”罗生门呼唤数据确权

作者:张孝荣

出版时间:2020-09-17

全文共3151字

A- A+


  日前,李开复关于人脸数据来源的话语,引发了公众对大数据安全性的关注。在HICOOL全球创业者峰会上,李开复表示,曾在早期帮助旷视科技公司找了包括美图和蚂蚁金服等合作伙伴,帮助其拿到了大量的人脸数据,并在随后的摸索过程中找到了几个有价值的商业化方向。结果立即招来几家企业联合否认,蚂蚁集团官方微博否认了曾向旷视提供人脸数据,同时表示在双方合作事宜上从未与李开复有过接触。李开复不得不公开发文“道歉”,自称口误云云。

  不过,许多疑云随之升起:“人脸数据随便复制走?”“我们的隐私还好吗?”“旷视,你能自己说说人脸数据咋来的吗?”

  我们不必期待官方表态中有真相。因为阿里系投资已经成为旷视的大股东,个中关系可想而知。工商统计数据显示,淘宝中国间接合计持有旷视已发行在外股份的14.33%,蚂蚁金服通过全资子公司间接合计持有旷视已发行在外股份的15.1%。从股权上可以看出,旷视和阿里系捆绑在一起,两者在业务上也合作紧密。

  我们也不必期待李开复表示自己对旷视的重大合作毫不知情。看看李开复介入旷视有多深就知道了。在2013年和2014年,旷视曾两次获得由李开复担任董事长兼CEO的创新工场融资。2017年,旷视和创新工场等机构共同成立了一家国际人工智能技术研究院。

  蚂蚁和旷视两家为何如此紧张?人脸数据有确权归属问题。旷视CEO印奇在2020世界人工智能大会发言中提到,当人脸识别越来越广泛时,最重要的问题是肖像权数据确权问题。这不仅是法律讨论,更关乎商业化产品设计当中的合同签订,包括法律确权过程以及后续法律纠纷中所涉及的问题。

  数据确权问题必须要弄好。弄不好,要吃官司,甚至翻船。例如,去年微软悄然关闭了号称全球最大的公开人脸数据库MS Celeb。该数据库发布于2016年,累计有大约10万人的1000万张人脸照片。“Celeb”源于“Celebrity(名人)”,顾名思义,微软利用搜索引擎整合了大量名人的公开照片。然而有研究人员发现,MS Celeb数据库中还有一些普通人的照片,这些人完全不知道到自己的人脸照片被收录。微软因此被指责侵犯隐私。同样引得群情激愤的还有美国企业Clearview AI。该公司以人脸识别检索而闻名,用户只需在其应用程序中上传某人的照片,即可获得TA在Face book、推特等社交平台上的照片和社交网站网址。Clearview AI从网上爬取了30多亿张人脸照片,却未经当事人授权。事情曝光后,Clearview AI在美国多地被起诉。例如今年3月,美国佛蒙特州总法务官就以违反消费者保护和数据法为由,在该州法院起诉了Clearview AI,要求Clearview AI停止收集佛蒙特州居民的照片,并销毁此前收集的数据存档。

  蚂蚁拥有天量用户数据,已经制定了IPO计划,很快就是一家影响力巨大的公众公司。旷视是AI独角兽,需要数据饲养AI机器,早晚也要上市。在这样的背景下,旷视、蚂蚁因人脸数据一事而节外生枝,实在得不偿失。

  但公众必须关注此事。光关注还不够,必须还要深度质询。众所周知,平台数据是个巨大资源,企业想要,政府也想要。在保护用户隐私的幌子下,用户实际上是在网上裸奔,没有啥隐私可言。

  长期以来,我们被平台洗脑了而不自知,总以为数据属于平台是一件自然而然的事情。常言道,用户流量就是水啊,平台是个流量池。言外之意,流量就是水,进了谁家就归谁。其实,从保护用户隐私角度来看,把用户数据视为水电一样的资源的理念,根本上就是错误的。

  真相是用户数据包括用户账号属于用户本人,不管是匿名的还是实名的信息,都是由用户生产,本质上属于用户所有,而不是像水一样的自然资源,属于无主之物,可以人类共有。

  因此,用户要关注的不仅是肖像权数据确权,还有用户账号确权,以及一切用户生产的数据确权。

  如果数据不确权给用户的话,就会带来一系列问题。

  首先,数字财产继承是个问题。既然用户账号属于平台,那么在用户去世后,其社交号码、游戏装备、好友粉丝及店铺等级等,就会被平台无偿拿走,这无论如何也是一件难以理解的事情。

  实际上,目前大多数网络平台的账号,用户均只有使用权。平台或在注册协议中明确规定账号所有权归属公司,或是以“您的账户只限您本人使用,不得出借、赠予、出租、转让许可他人使用”等解释说明。

  那么,用户的平台账号,到底属不属于本人?手机号码,到底属不属于本人?比如用户花钱办理了一个银行卡,结果显示“本卡属xx银行所有”“本卡所有权属xx银行”。现在都实名制了,用户的号码或账号已经绑定了个人真实信息,并且关联指纹和人脸,居然还不属于本人所有,就像房子所有权不属于产权人而属于房地产开发商一样。这岂不是很滑稽。

  其次,数据泄密问题。数据确权了就能解决一切问题吗?非也。确权只是第一步,确权后还需要进一步限制使用权。不然就会像Facebook 一样泄密。2018年3月,Facebook被媒体曝光,其超过5000万用户的信息数据被一家名为“剑桥分析”(CambridgeAnalytica)的公司泄露,用于2016年美国总统大选时,针对目标受众推送广告,从而影响大选结果,此事在世界范围内激起了轩然大波。

  经用户授权后,收集的信息包括用户的年龄、住址、性别、种族、教育背景等个人信息,以及在社交网络中发表、阅读、点赞的内容,还包括用户的朋友所发布的信息等。当时,共有约27万人下载了这一应用,再加上公开途径收集的用户信息,共涉及5000万用户的数据。扎克伯格和议员、公众对Face book事件的看法并不一致,前者不认为是泄密,至多是被滥用;后者则认为个人数据被不当分享就是泄密。彼时,Facebook向美国联邦贸易委员会(FTC)缴纳了50亿美元(约合人民币341亿元)的罚款,打破了类似罚款的金额纪录,被称为“史诗级”罚款。

  要知道,Facebook用户是具有信息所有权的。Facebook用户协议里提到“您对自己在Facebook发布的所有内容和信息拥有所有权,并且可以通过隐私和应用程序设置控制这些内容和信息的分享。”Facebook此次无可奈何地接受了巨额罚单,下次就会小心谨慎。

  反之,没有数据确权或确权不足的条件下,又会怎样?常见的情况就是轻描淡写地总结,自罚三杯了事。

  再次,数据欺诈问题。除数据泄密问题外,还有数据收集和不当使用问题。

  去年“大数据杀熟”成为热词。原因是有网友爆料称,他经常通过某网站预订特定酒店房间,价格一直保持在380元~ 400元。偶然一次,他通过酒店前台了解到,该房间淡季的价格仅为300元左右。消息发出后,不少网友反映也遭遇过类似的“杀熟”。有网友发现,同一场电影,影院针对新老用户的定价就不同;还有的消费者表示,同一个商品,有的电商平台对新用户与VIP用户的定价也不同;还有人说,某打车软件,同一时间、同样起点和终点的行程预估价格差异可以达到20%以上。此事引发一片热议,随后,北京市消协发起问题调查,有五成被调查者表示曾遭遇“大数据杀熟”。

  值得注意的是,“大数据杀熟”不需要真实身份信息,平台只要收集了你的使用记录,就可以分析出你的消费特征和消费偏好,继而进行欺诈性消费推荐。对此类交易型平台的收集数据不当使用行为,必须加以限制。

  总之,大数据绝不是无主之水,必须加以确权、杜绝泄密,并且限制收集和使用。

  长期以来,一些互联网巨头阻挠将数据确权给用户个人,强调所有数据归属平台,因此已导致出现一系列问题,影响行业的健康发展。

  其实,大数据社会的建设也应该有底线思维,应该明确所有权归属用户个人。企业可以在用户授权后有限使用,而不能无限开发;要以用户利益为本,严守信息底线。

(010)64963755