10 万人,1000 万张照片,全球最大人脸识别数据库被秘密删除

日期:2023-02-22 15:21:52 / 人气:274

人脸辨认技术开展到明天,曾经不只仅在技术开展层面遭到关注,实践上,在政策和用户隐私层面,它惹起的争议越来越多,在某些区域或许范畴也颇不受待见(参见雷锋网此前报道);比方说,2019 年 5 月,旧金山市对人脸辨认技术收回了禁令,制止该技术在政府机关和执法机关中运用,从而成爲全球首个对人脸辨认技术收回禁令的城市。近日,微软企业悄然删除了该企业于 2016 年发布的人脸辨认数据库 MS-Celeb-1M——该数据库是全球最大的地下人脸辨认数据库。微软为何要发布 MS-Celeb-1M 数据库?2016 年 8 月,微软在官网中发布了一篇题爲《MS-Celeb-1M: A Dataset and Benchmark for Large-Scale Face Recognition》的论文,论文作者包括来自微软研讨院的 (目前他曾经分开微软参加) Lei Zhang(张磊), Yuxiao Hu, Xiaodong He, Jianfeng Gao 等人。在这篇论文中,微软引见了一个名爲 MS-Celeb-1M 的人脸辨认应战赛,参赛者需求依据微软提供的数据集作爲训练数据来开发本人的图像辨认零碎,以便从 100 万个名人名单中停止人脸辨认。与此同时,随着这一应战赛,微软也发布了一个面向大众开放下载的大规模人脸辨认数据集 MS-Celeb-1M,其中第一个版本包括了 10 万个名人(依据他们的受欢送水平,从上述 100 万个名人名单中选择而来)的 1000 万张脸部照片,来供研讨者开发本人的人脸辨认技术——微软声称,这些照片来自于人们常用的搜索引擎,也就是地下途径。以 Lady Gaga 爲例,我们来看一下数据库中的相照顾片:微软声称,该数据库是全球最大的地下人脸辨认数据库。微软技术与研讨院首席研讨员 / 研讨经理张磊(即上述论文作者中的 Lei Zhang)博士曾对表面示,MS-Celeb-1M 的目的是辨认百万人脸,是计算机视觉内最大规模的分类成绩,并且其中一团体物对应一个 entity,绑定了知识库,并且知识库中提供了每团体的职业,性别等等丰厚的信息,从而处理了人物重名的成绩,可以从辨认到达认知。基于这一数据库,微软举行了 MS-Celeb-1M 百万名人辨认竞赛,这一竞赛被业界以为是人脸辨认的年度 “世界杯”。其中,在 2017 年的微软百万名人辨认竞赛中:Panasonic-新加坡国立大学协作夺得第一,CIGIT(中科院重庆绿色智能技术研讨院)和中科院协作队伍位列第二,美国西南大学位列第三。虽然在微软的认知中,最开端这个数据集是面向学术界做的,但后来,这一数据集被许多工业界的同行所运用。依据相关的引文材料,MS-Celeb-1M 数据库曾经被多商业机构所运用,比方说 IBM、松下电气、阿里巴巴、辉达、日立、商汤科技、旷视科技等,甚至有音讯称,也有相关的军事研讨人员采用了这一数据库来训练面部辨认零碎。微软删除了,但它存在于全世界的硬盘里但是,随同着人脸辨认技术的开展,人们对相关隐私的关注和担忧越来越多添加,也有人以为微软的这一数据库涉嫌进犯隐私,比方说来自德国柏林的艺术家和技术专家 Adam Harvey,他在本人的 Megapixel 项目中记载了包括 MS-Celeb-1M 在内的数据库的详细信息以及运用用户。Adam Harvey 以为,微软用 Celebrity 一词指的是那些在网上打工并且在数字世界具有知名度的人,而不只仅是 Lady Gaga、Steve Jobs 这样的名人。比方说,有媒体在针对 MS-Celeb-1M 数据库中的人脸停止核实后发现,MS-Celeb-1M 确实包括了不少名人的照片,比方说 Lady Gaga、Steve Jobs 等,但是也包括一些媒体人的信息,比方说《连线》杂志担任报道网络立功、网络平安、隐私等成绩的初级记者 Kim Zetter。实践上,针对微软涉嫌进犯隐私成绩,英国《金融时报》也设法联络了被收录在 MS-Celeb-1M 数据库的当事人,某些当事人甚至基本不晓得本人的照片曾经被收录——比方说科技作家 Adam Greenfield;他在承受采访时表示,本人绝不是大众人士,无法保持本人的隐私权。也就是说,微软在数据库中运用的照片,并没有征妥当事人的赞同,即便他们是名人。当然,微软本人也认识到了这个成绩,目前它曾经删除了 MS-Celeb-1M 数据库;在对英国《金融时报》的回应中,微软表示:这个网站本来是用于学术目的,它是由微软的一个前员工来运营的。目前,该员工曾经分开微软,因而我们也曾经移除了它。值得一提的是,随同着微软删除了 MS-Celeb-1M 数据库,另外两个学术单位也删除了它们旗下的相似相关数据库,包括由杜克大学研讨人员建造的 Duke MTMC 监控数据库和斯坦福大学的 Brainwash 数据库。就目前的状况来看,微软用来引见 MS-Celeb-1M 项目的网站还在,但是数据集自身曾经不能下载;但是,据雷锋网搜索发现,相关的数据库资源仍然可以从其他网站停止下载。更重要的是,作爲一个地下下载的数据集,MS-Celeb-1M 实践上曾经存在于不少公司或机构的本地硬盘中,被用作各类的用处,而照片当事人却无法左右。正如,Adam Harvey 所言:一旦你发布了它,人们下载了它,那它就会存在于全世界的硬盘里。- END -◆  ◆  ◆引荐阅读腾讯云复制粘贴美官员恳求延期禁华爲;Salesforce 157亿美元收买Tableau;格力奥克斯“掐架”新停顿谷歌游说美政府解除华爲Android禁令;搜狐参加社交大战推出狐友;库克:中国封杀苹果事情不会发作智能手表eSIM化,走向独立人格的第一步解读 | 苹果推出 iPadOS 的真正意图是什麼?CCF-GAIR 2019由中国计算机学会主办、雷锋网和香港中文大学(深圳)结合承办的 2019 全球人工智能与机器人峰会,将于 2019 年 7 月 12 日至 14 日在深圳举行。届时,诺贝尔奖得主JamesJ. Heckman、中外院士、世界顶会主席、知名Fellow,多位重磅嘉宾将亲身坐阵,一同讨论人工智能和机器人范畴学、产、投等复杂的生活态势。昔日限量赠送10张850元门票优惠码,门票原价1999元,现价仅1149元,限量10张,送完即止。(在大众号对话框中回复关键字【门票优惠码】,即可取得)在看点这里

作者:恩佐娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 恩佐娱乐 版权所有