人脸识别到底是什么?

2021-06-28 15:00:27

人脸识别,是视觉模式识别的一个细分问题,也大概是最难解决的一个问题。 其实我们人每时每刻都在进行视觉模式识别,我们通过眼睛获得视觉信息,这些信息经过大脑的处理被识别为有意义的概念。于是我们知道了放在我们面前的是水杯、书本,还是什么别的东西。
  
我们也无时无刻不在进行人脸识别,我们每天生活中遇到无数的人,从中认出那些熟人,和他们打招呼,打交道,忽略其他的陌生人。甚至躲开那些我们欠了钱还暂时还不上的人。

然而这项看似简单的任务,对机器来说却并不那么容易实现。

对计算机来讲,一幅图像信息,无论是静态的图片,还是动态视频中的一帧,都是一个由众多像素点组成的矩阵。比如一个1080p的数字图像,是一个由1980*1080个像素点组成矩阵,每个像素点,如果是8bit的rgb格式,则是3个取值在0-255的数。
机器需要在这些数据中,找出某一部分数据代表了何种概念:哪一部分数据是水杯,哪一部分是书本,哪一部分是人脸,这是视觉模式识别中的粗分类问题。

而人脸识别,需要在所有机器认为是人脸的那部分数据中,区分这个人脸属于谁,这是个细分类问题。