编辑导语:人脸识别产品早已应用到生活的每一个场景。但是你知道它是如何工作的吗?在本文中,作者拆解了人脸识别的原理。有兴趣的话,我们一起看。
现在AI如火如荼,我们也逐渐进入了智能时代。虽然人工智能是技术性的,但是学习和理解需要一定的技术背景和数学支撑。但拆开来看,它的原理、方法、思路并不复杂,“不懂技术”的产品经理也能看懂。
人工智能涉及多个学科,知识点相互交织,需要多学科知识储备。从学习路径来看,更适合做一个系列,由浅入深,由基础到应用,逐步深入。但无形中提高降低了学习门槛,降低了学习兴趣,难以坚持。
考虑到这一点,我想以一种轻松探索的视角和大家一起探索,用一种简单直白的方式学习AI。这样虽然会有错漏等。学习难度会降低,所以要在过程中改进。毕竟“模糊的正确大于精确的错误”。
一、人脸识别产品我们从人脸识别开始,逐渐了解其技术路径的演变和原理。今天,我们先从最简单的原理说起。
其实人脸识别早就有了。多年前以刷脸考勤的形式出现,但由于使用效果差,用户体验差,逐渐被市场淘汰。
而这波人工智能热,算力,模型等。都是其重要的驱动力,但更重要的是产品能够落地,能够在实际的商业场景中使用。
尤其是人脸识别,产品的识别准确率、速度、用户友好性等方面都有了显著提升,用户和市场的接受度显著提升。
二、图像表征要理解人脸识别,必须从图像表征入手。
众所周知,计算机能够识别和处理的是二进制。无论我们输入什么文本、图像或声音,计算机都是用一定长度的二进制字符串来存储和处理的。
我们以黑白图片为例,看看电脑是如何表现的。
电脑可以将黑白图片表现为灰度图像。在灰度图像中,一个像素使用8位,因此可以表示256个灰度级,表示范围为0-255。其中0代表纯黑,255代表纯白。
一个字节可以代表一个像素,那么怎么能代表一张图片呢?它用一个矩阵来表示。
简单来说,就是一张桌子。例如,8行和8列可以用来表示8*8灰度图像。
这样就解决了图像表示的问题,建立了图像与矩阵的等价关系。图片可以转换成矩阵,也可以通过矩阵恢复原图。
你能算出下面的矩阵代表什么吗?
是的,我一眼就能看出数字1。似乎每个人都有从事AI的天赋。走吧。
3.图像识别图像用矩阵表示后,各种图像处理都转化为数学问题,可以用数学理论和方法来解决,而这正是计算机所擅长的。
我们输入图片,希望计算机能识别内容,输出结果。
以数字为例,当一个输入图片用矩阵表示时,通过将灰度值转换成灰度值,很容易识别出它代表的是什么。
但在计算机世界里,只有0和1。如果要识别基准表的内容并输出结果,必须建立基准表和结果之间的映射。这样,输入一张图片,经过处理和计算,就可以输出一个数字。
简单的思路就是把每个数代表的矩阵预先存储在电脑里。当输入一张图片时,计算机通过计算找到最适合输出的数字。
比如更容易理解。例如,计算机已经存储了数字1和7以及它们对应的灰度矩阵。
第一名
7号
当一个新的图像被输入时,程序会自动计算它的矩阵和这些矩阵之间的相似度。相似度计算有很多公式,比如百分比,距离等。
为简单起见,采用两个矩阵对应元素之差的绝对值之和或平方和,计算机进行快速运算,找出最相似的矩阵,然后输出它所代表的数字。
当你输入如下,简单计算后就可以知道输出结果是7。
四。人脸表示既然一张图片可以用矩阵来表示,人脸也是一张照片,那么也可以用同样的方法来表示。下面的面可以表示为:
面部照片
矩阵表示
5.人脸识别虽然叫人脸识别,但更准确的名字应该是“人脸比对”。人脸识别的背后,是将一张待比对的图片与人脸数据库中的所有图片进行比对,从而识别出图片中人的身份。
一般来说,要对比的照片是我们日常生活中各种设备拍摄的照片,比如人脸识别考勤机拍摄的照片。
由于环境、姿势等原因,采集到的照片差异较大,导致比对成功率较低。为了提高比对的成功率和速度,很多人会同时抓拍多张人脸进行识别,但每次比对时只输入一张照片。
所谓人脸库,就是我们事先在系统中录入的人脸照片,照片与我们的名字一一对应。根据人脸数据库中的照片数量,人脸比对可分为1:1和1: n两种,由于数量不同,这两种方法的计算量和计算方法也不同。
1.1:11:1最常见的场景就是见证比对,比如我们坐高铁遇到的这种设备。
前面1代表我们从设备上采集的照片,后面1代表身份证里的照片。通过现场采集的照片与身份证存储的照片对比,可以确定持证人是否为本人。
这种情况下只涉及两张图片的比较,计算量比较小。
可能会用到火车票安检等场景,所以要求的准确率高。
身份证中的照片像素较小,市面上的身份证阅读器读取的照片也只有100*100像素左右,给准确性带来了一定的挑战。
目前这个领域已经比较成熟,使用场景也在逐步铺开。
2.1:N1:与数据库中的N张脸相比,N是一张脸。
比如考勤机,我们的人脸数据库里包含了全公司所有的人脸照片。打卡时考勤机采集人脸输入系统,比对后输出员工身份。
这种情况下计算量比较大,时效性和识别准确率太低,会影响用户体验。所以厂商一般会考虑取舍,在设备的参数中标注支持面数。
这一波人工智能的发展,带动了人脸识别技术在1: n领域的进步,更多的产品可以在各种场景落地。比如智慧城市、智能家居等。
国内厂商也借着这一波东风,加快技术研发和产品落地,诞生了著名的AI视觉四小龙等独角兽。
今天我们梳理了人脸识别的基本原理。虽然整个实现过程看起来很简单,但该技术在基本原理的基础上不断改进和完善,最终取得了良好的效果。
下一次,我们将讨论复杂场景下人脸识别面临的挑战和解决方案。
作者:AIoT products,10年B端产品设计经验;微信官方账号:AIoT产品
本文由@AIoT Products原创发布。每个人都是产品经理。未经许可,禁止复制。
来自Unsplash的图像,基于CC0协议。