
人臉識(shí)別,是視覺(jué)模式識(shí)別的一個(gè)細(xì)分問(wèn)題,也大概是最難解決的一個(gè)問(wèn)題。其實(shí)我們?nèi)嗣繒r(shí)每刻都在進(jìn)行視覺(jué)模式識(shí)別,我們通過(guò)眼睛獲得視覺(jué)信息,這些信息經(jīng)過(guò)大腦的處理被識(shí)別為有意義的概念。于是我們知道了放在我們面前的是水杯、書本,還是什么別的東西。
我們也無(wú)時(shí)無(wú)刻不在進(jìn)行人臉識(shí)別,我們每天生活中遇到無(wú)數(shù)的人,從中認(rèn)出那些熟人,和他們打招呼,打交道,忽略其他的陌生人。甚至躲開那些我們欠了錢還暫時(shí)還不上的人。
然而這項(xiàng)看似簡(jiǎn)單的任務(wù),對(duì)機(jī)器來(lái)說(shuō)卻并不那么容易實(shí)現(xiàn)。
對(duì)計(jì)算機(jī)來(lái)講,一幅圖像信息,無(wú)論是靜態(tài)的圖片,還是動(dòng)態(tài)視頻中的一幀,都是一個(gè)由眾多像素點(diǎn)組成的矩陣。比如一個(gè)1080p的數(shù)字圖像,是一個(gè)由1980*1080個(gè)像素點(diǎn)組成矩陣,每個(gè)像素點(diǎn),如果是8bit的rgb格式,則是3個(gè)取值在0-255的數(shù)。
機(jī)器需要在這些數(shù)據(jù)中,找出某一部分?jǐn)?shù)據(jù)代表了何種概念:哪一部分?jǐn)?shù)據(jù)是水杯,哪一部分是書本,哪一部分是人臉,這是視覺(jué)模式識(shí)別中的粗分類問(wèn)題。
而人臉識(shí)別,需要在所有機(jī)器認(rèn)為是人臉的那部分?jǐn)?shù)據(jù)中,區(qū)分這個(gè)人臉屬于誰(shuí),這是個(gè)細(xì)分類問(wèn)題。


