新疆博斯腾湖百鸟起舞落霞湾

新疆博斯腾湖落霞湾,成群结队候鸟聚集在这里或悠闲觅食。年磊 摄

近年来,随着博斯腾湖生态环境的不断改善和各族群众保护野生动植物意识的不断提高,博斯腾湖野生鸟类品种和数量不断增加。年磊 摄

同样被应用到百度自家园区的还有其针对多人、戴口罩、远距离的人脸检测近日推出的“企业AI入场解决方案”。

人脸识别技术之所有在国内普及速度如此之快,是因为其后有大批互联网公司在推动。BAT在此之前其实都有相关专利在手,疫情期间,也可见腾讯优图推出的“口罩佩戴识别专用AI”、商汤科技公布的“读取眼部、嘴部和鼻部周围240个面部特征点的人脸识别算法”,以及百度视觉团队推出的“戴口罩人脸识别算法”。

2020年,人脸识别技术已经嵌入到生活中各个方面,解锁手机时需要刷脸、在线支付时需要刷脸、上班打卡时需要刷脸、乘机过安检时需要刷脸;人脸识别技术也在各方面悄悄影响着这个社会,抓捕嫌犯时会用到人脸识别技术筛选罪犯、酒店入住时需用人脸识别技术验证身份。

近年来,随着人脸识别技术成熟度不断提高,相关产品在国内诸如酒店登记、车站人群筛查、公司考勤等场景应用已经十分广泛。以公司考勤为例,据2018年相关产业调研数据显示,人脸识别考勤机出货量已突破百万。

“靠脸吃饭”的时代终将到来

当前我国疫情防控工作处于关键时期。慢病群体可通过京东健康购买到所需的处方药,京东健康在线问诊平台7×24小时为慢性病群体提供免费问诊服务,用户只需在京东健康APP、京东健康小程序、京东APP搜索所需药品名称,提交预约,互联网医院医生复诊开方,线上药师审核处方后,京东物流等快递合作伙伴将以最快的速度送药上门,最快30分钟送达。

计算机视觉作为当下拥有高商用价值的人工智能技术之一,除被互联网巨头厂商紧盯外,也可见众多AI独角兽企业的步步紧逼。

这些候鸟或展翅低飞,或竞相追逐,为寂静的湖面增添了一道移动的风景线 年磊 摄

由此可见,百度视觉技术及其研发团队,俨然成了别人家的孩子,也正是这些别人家的孩子正在助推计算机视觉在各产业领域持续商业化。

训练结果因人而异,也有博主表示,训练数百次也没能让自己的“傻儿子”认识戴口罩的自己。

技术研发能力上,百度早在2016年对外开放了其深度学习平台飞桨(PaddlePaddle),在IDC 2019年发布的《深度学习框架和平台市场份额》分析报告中,飞桨平台在国内市场排名第三,与谷歌、Facebook一起坐拥近80%的国内市场份额。

第一,人脸识别算法主要依据人脸面部特征进行身份判定,佩戴口罩会使下巴、嘴部、鼻子等用于识别的脸部特征大量丢失; 第二,当前人脸识别算法使用的深度学习技术依赖海量的训练数据,短期内难以收集到大量佩戴口罩照片,并进行人工标注; 第三,人脸识别系统一般包含人脸识别、跟踪、活体检测、识别等多个模块,佩戴口罩影响的不仅仅是人脸检测模块的工作情况,而是对系统中每个模块都带来了很大的影响。

此外,计算机视觉顶级学术会议CVPR 2020在近日公布了收录的论文,录取率创下新低,相比去年下降3%,仅有22%,但百度仍有22篇论文入选,其中针对人脸识别和检测被收录的论文提出了在线高质量锚点挖掘策略HAMBox、从单幅图像预测高精度可操控人脸三维模型、大尺度高精度人脸三维模型数据库FaceScape、基于神经网络架构搜索同时搜索适合人脸检测的特征提取器和特征金字塔的BFBox等模型和方法。

此前,多位来自不同医疗领域的权威专家也联名发起倡议,表示:“希望广大慢病患者充分利用互联网平台优势,来做好自我居家防护和日常康复护理。” 京东健康“慢病关爱计划”正是在这一背景下启动的。慢病患者可以通过京东大药房提供的复诊、续方、购药、配送一站式服务,在线轻松购买处方购药。

事实上,佩戴口罩属于大面积遮挡问题,在人脸识别领域是一个公认的难题,难点主要有三个:

在这之前,如何将视觉算法的复杂环境适应能力、成熟度、安全性做到极致,仍要靠各家的研发团队以及开源力量的长期打磨。雷锋网雷锋网雷锋网(公众号:雷锋网)

传统直接在人脸上叠加口罩图片的方法,由于人脸姿态变化和不同场景采集图像的分布差异等问题,无法真实模拟实际场景中的戴口罩人脸图片,实验结果表明效果提升非常有限。因此,百度视觉团队采用了基于人脸关键点的三维图像融合技术,不仅解决了人脸姿态变化带来的口罩形变和遮挡问题,同时生成的照片更加自然、真实,最终,通过收集市面上各种颜色、大小和样式的口罩图片,与之前积累的未佩戴口罩人脸图片进行融合,快速合成了各种场景、海量真实的戴口罩训练照片。

百度视觉技术,会是别人家的孩子吗

2月28日,在新疆博斯腾湖落霞湾,成群结队候鸟聚集在这里或悠闲觅食,或展翅低飞,或竞相追逐,为寂静的湖面增添了一道移动的风景线。随着气温的回升,新疆博斯腾湖湖区浅水冰层逐渐融化,部分湖面和草滩开始裸露,候鸟不用再担心无处觅食,开始纷纷回归,开始新一年的生活。

技术商业化能力上,此次百度研发的“戴口罩人脸识别算法”也已经与科升智能、十牛信息、华捷电子、智体科技联合在诸如城中村出租屋门禁改造、智慧校园、公共交通人脸识别、出租车驾驶行为分析等应用场景中。此外,在线下门店无感刷脸购物、智慧社区刷脸门禁、企业员工刷脸考勤等应用场景,也已有超过100家开始使用。

雷锋网原创文章,。详情见转载须知。

对于京东的这一计划,大量业界厂商都积极响应。诺华制药(中国)总裁张颖表示,“非常有幸能与京东健康合作,为慢性疾病患者提供一站式的线上医药服务,运用我们在高质量创新产品组合和丰富的疾病管理经验,为慢病患者提供用药便利,满足患者的用药需求”,而优时比中国区总经理吴昕表示:“优时比全力支持此次京东健康推出的‘慢病关爱计划’,帮助慢病患者在疫情期间,能及时获得诊疗、处方并购药。这也是我们对社会尽责的一部分。”

百度在计算机视觉方面的技术能力及相关产品皆基于这一平台打造,在此次“戴口罩人脸识别算法”研发过程中,使用基于百度飞桨(PaddlePaddle)的大规模分类库PLSC,实现了快速对数百万ID的训练数据进行训练;采用飞桨模型压缩库PaddleSlim进行模型搜索与压缩,产出了高性能的人脸识别模型;使用飞桨PaddleLite,实现了云端和移动端的快速部署。并且在2月13日,百度在业内首个宣布开源基于飞桨的口罩人脸检测及分类模型, 该模型可以有效检测密集人流区域中的所有人脸,并判断其是否佩戴口罩,目前已通过飞桨 PaddleHub 对外开源。

其次,针对缺乏戴口罩训练数据的问题,百度算法团队通过人工生成的方式来解决。

显然,“戴口罩人脸识别算法”识别的已经不再是人脸,而是“身份信息”相对更为集中的、没有被遮挡的眼部,这样势必会降低人脸识别算法的准确率,为了保证“戴口罩人脸识别算法”的准确率,算法团队也需要花大功夫进一步优化算法。

目前来看,衡量计算机视觉能力强弱可以参照两方面实力,一方面是技术研发能力,另一方是技术商业化能力。

例如检测算法采用了百度最新的PyramidBox-lite检测算法,并加入超过10万张口罩人脸数据训练,在准确率不变的情况下,召回率提升了30%;口罩分类算法基于人脸关键点网络抽取具有丰富面部语义信息的人脸特征表示,并基于该特征进行口罩遮挡判断,通过PaddleSlim进行模型压缩,模型大小压缩超过3倍。

最后,在人脸识别系统的各个环节,针对戴口罩问题,百度算法团队做了一系列的优化。

复工后,人脸识别碰壁了

也是在这一天,百度视觉团队开始研发“戴口罩人脸识别算法”。

然而,在2020年,一场疫情让国民纷纷戴上了口罩。口罩成为国民“刚需”后,开始频频脱销,而年后复工的你发现,你家公司门口那台你原以为很高科技的人脸识别考勤机已经完全不认识戴着口罩的你。

基于这一发现,通过采用基于空间位置的注意力机制特征学习方法,充分获取戴口罩人脸的身份信息。

基于空间位置的注意力机制特征学习

由于苹果从iPhone X就已经开始使用Face ID进行手机解锁,Face ID采用的又是安全性很高的3D人脸识别技术,近期,不少苹果手机用户表示“带上口罩后,手机都不好使了”,网上甚至出现大量教学视频,教学如何训练你的iPhone,让你的iPhone认识戴口罩的你。

当人脸识别,识别的不再是人脸……

1月21日,从北京回到广州的钟南山参加了当地首场新冠肺炎疫情新闻发布会,会上钟南山表示,新冠肺炎已经出现人传人。

虽然当下的用户的交互习惯仍停留在按键、触屏、语音交互方式上,“解锁”习惯仍停留在密码、指纹等识别方式上,但是由于人脸识别的便利度和安全性,未来终将会是一个“靠脸吃饭”的时代。

博斯腾湖已成为鸟类迁徙途中停留、觅食、繁殖的天然场所。年磊 摄

首先,针对遮挡带来的信息丢失问题,百度视觉团队发现,人脸各个区域包含的用于身份识别的信息量不是均匀分布的,眼部区域相比其他位置包含了更多的身份信息,所以只要让算法更加关注对眼部区域的特征学习,就能将佩戴口罩、帽子等遮挡带来的信息丢失对算法识别率的影响降到最低。

那么,当人脸识别不再能识别到你的脸,它还会认识你吗?

2月21日,百度视觉团队完成“戴口罩人脸识别算法”的研发和优化,该算法随后也被应用到了百度园区中。