博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
微软删最大脸部辨识数据库 MS-Celeb-1M
阅读量:6004 次
发布时间:2019-06-20

本文共 1892 字,大约阅读时间需要 6 分钟。

微软为什么要发表 MS-Celeb-1M 数据库? 2016 年 8 月,微软官网公布题为《MS-Celeb-1M: A Dataset and Benchmark for Large-Scale Face Recognition》的论文,作者包括微软研究院 Yandong Guo(郭彦东,已离开微软加入小鹏汽车)、Lei Zhang(张磊)、Yuxiao Hu、Xiaodong He、Jianfeng Gao 等人。

论文中微软介绍名为 MS-Celeb-1M 的脸部辨识挑战赛,参赛者需要根据微软提供的数据集为训练数据开发自己的图像辨识系统,以便脸部辨识 100 万个名人。挑战赛同时,微软也发表针对公众开放下载的大规模脸部辨识数据集 MS-Celeb-1M,第一版包含 10 万个名人(根据他们的受欢迎程度,从上述 100 万个名人选出)的 1 千万张脸部照片,供研究者开发自己的脸部辨识技术──微软宣称,这些照片来自人们常用的搜索引擎,也就是公开管道。以 Lady Gaga 为例,看一下数据库的相关照片:

微软宣称,此数据库是全球最大的公开脸部辨识数据库。微软技术与研究院首席研究员/研究经理张磊(即上述论文作者的 Lei Zhang)博士曾表示,MS-Celeb-1M 的目标是辨识百万人脸,是计算机视觉最大规模的分类问题,且其中一个人物对应一个 entity,绑定知识库,知识库提供每个人的职业、性别等丰富信息,解决人物重名的问题,可从辨识达到认知。基于这个数据库,微软举行了 MS-Celeb-1M 百万名人辨识竞赛,业界公认为脸部辨识的年度「世界杯」。2017 年的微软百万名人辨识竞赛,Panasonic─新加坡国立大学合作夺得第一,CIGIT(中科院重庆绿色智慧技术研究院)和中科院合作队伍位列第二,美国东北大学位列第三。虽然在微软的认知中,最开始这个数据库是针对学术界,但后来这个被许多业界同行使用。根据相关的引文数据,MS-Celeb-1M 数据库已被多商业机构使用,比如说 IBM、松下电气、阿里巴巴、辉达、日立、商汤科技、旷视科技等,甚至有消息称,也有相关军事研究人员采用此数据库训练脸部辨识系统。

微软删除了,但它储存在全世界的硬盘里 然而,伴随着脸部辨识技术的发展,人们对相关隐私的关注和担忧越来越增加,也有人认为微软数据库涉嫌侵犯隐私,比如说德国柏林艺术家和技术专家 Adam Harvey,他在自己的 Megapixel 计划记载了包括 MS-Celeb-1M 等数据库详细信息及用户。Adam Harvey 认为,微软用 Celebrity 一词指的是那些在网络工作并在数字世界具知名度的人,不仅是 Lady Gaga、Steve Jobs 这类名人。

比如说,有媒体核对 MS-Celeb-1M 数据库的脸部后发现,MS-Celeb-1M 的确包含不少名人照片,比如 Lady Gaga、Steve Jobs 等,但是也包含一些媒体人的数据,例如《联机》杂志负责报导网络犯罪、网络安全、隐私等问题的资深记者 Kim Zetter。针对微软涉嫌侵犯隐私问题,英国《金融时报》也设法联系了收录在 MS-Celeb-1M 数据库的当事人,某些当事人甚至根本不知道自己的照片被收录──比如科技作家 Adam Greenfield;他接受采访时表示,自己绝不是公众人士,无法放弃自己的隐私权。也就是说,微软数据库使用的照片,并没有征得当事人同意,即使他们是名人。当然,微软也意识到这个问题,目前已删除 MS-Celeb-1M 数据库;响应英国《金融时报》时微软表示:这个网站原本是用于学术目的,是由微软前员工营运。目前该员工已离开微软,我们也移除了它。相关内文来源:FUN88公益台

值得一提的是,微软删除了 MS-Celeb-1M 数据库,另外两个学术单位也删除旗下的类似相关数据库:杜克大学研究人员建造的 Duke MTMC 监控数据库和史丹佛大学的 Brainwash 数据库。就目前的情况来看,微软用来介绍 MS-Celeb-1M 计划的网站还在,但数据库本身不能下载;然而搜索发现,相关数据库资源依然可从其他网站下载。更重要的是,既然曾被公开下载,MS-Celeb-1M 已储存在不少企业或机构的硬盘,用作各类用途,照片当事人还是无法左右。正如 Adam Harvey 所言:一旦你发表了,人们下载了,那数据就会储存于全世界的硬盘里。

转载于:https://juejin.im/post/5d01fa335188256cd366d2b7

你可能感兴趣的文章
激光投影机和灯泡投影机的对比
查看>>
安装jdk
查看>>
登录失败:禁用当前用户 解决方法
查看>>
json字符串转java对象
查看>>
linux基础篇-20,seq命令的用法
查看>>
shell学习笔记 (5)
查看>>
PowerDesigner生成数据库建表sql脚本
查看>>
数据库设计之拆分与数据类型选择
查看>>
mount命令的使用
查看>>
Git学习--打标签
查看>>
使用ssh方式 连接到github
查看>>
Mongodb安装以及账户管理(一)
查看>>
什么时候使用存储过程比较适合?
查看>>
制作ubuntu系统u盘镜像,以及安装
查看>>
十九个cPanel系统管理员不得不会的自动化脚本
查看>>
python爬虫整理——爬虫简介
查看>>
JavaWeb导入第三方jar包
查看>>
swift3.0layer折叠 淘宝商品View折叠
查看>>
Git忽略文件配置
查看>>
JAVA多线程深度解析
查看>>