摘 要:單樣本人臉識別的關鍵在于充分挖掘單樣本判別性信息,采用深度稀疏自編碼網絡與空頻域多LBP特征融合進行特征提取。首先利用部分樣本訓練深度稀疏自編碼網絡,利用訓練好的網絡分別提取訓練及測試集的特征;其次,利用二維離散小波變換將時域樣本變換到頻域,實現樣本擴展,增加單樣本信息并分別提取各域上的多LBP特征;最后利用協同表示對深度自編碼網絡及多LBP特征進行分類識別,融合識別結果獲取最終分類結果。在AR及PIE數據庫上的實驗結果表明,該融合算法能提高樣本判別性信息的提取,提高單樣本人臉識別性能。
關鍵詞:稀疏自編碼;單樣本人臉識別;空-頻特征;多特征融合;二維離散小波變換;數據庫
《物聯網技術》雜志是目前國內第一本經國家新聞出版總署批準,手續齊全的物聯網專業科技期刊。物聯網是繼計算機、互聯網之后世界信息技術的第三次革命,據美國獨立市場研究機構Forreter預測,物聯網所帶來的產業價值要比互聯網大30倍,將形成下一個上萬億元規模的高科技市場。
0 引 言
人臉識別是計算機視覺和模式識別領域重要的研究課題,在生活中應用廣泛,如視頻監控[1]、門禁[2]、行人再識別[3]、視覺追蹤[4]等。盡管目前已有的人臉識別算法在特定環境下性能較好,但在實際測試中人臉可能含有多重面部變化,例如光照、陰影、姿勢、表情、遮擋、不對齊等[5],因此人臉識別仍是一項具有挑戰性的任務。
在許多實際應用場合中,每人僅有一個訓練樣本,例如ID卡認證、航空港監測等,導致在單樣本識別中很難根據訓練樣本預測測試樣本中可能出現的類內變化信息,因此單樣本人臉識別仍是人臉識別中的難點。而傳統的判別性子空間學習算法,例如線性判別分析(Linear Discriminant Analysis,LDA)[6]、基于Fisher的算法[7-8]在此種情況下會失效。基于表示的分類算法如稀疏表示(Sparse Representation-based Classifier,SRC)[9]和協同表示(Collaborative Representation-based Classifier,CRC)[10]要求每類用多個訓練樣本來有效表示測試樣本,因此其在單樣本識別中性能也會大幅下降。
為處理單樣本人臉識別,研究人員提出多種算法,這些算法大致可以分為兩類[11],即全局算法和局部算法。全局算法[12-13]用整張人臉圖像作為輸入,其主要思想是擴大訓練樣本數以捕捉類內信息。文獻[14]中有兩個方向,分別為虛擬樣本生成和通用學習。虛擬樣本生成利用真實訓練樣本合成虛擬樣本,例如SPCA[15]和SVD-LDA[16]基于奇異值分解(Singular Value Decomposition,SVD)生成虛擬樣本。這些算法的主要缺點是虛擬樣本往往與訓練樣本高度相關,因此很難作為獨立的樣本進行特征提取[14]。
與基于虛擬樣本算法不同,泛型學習方法通常會引入一個輔助泛型集,由不感興趣的人員來補充原始的SSPP(Single Sample per Person,SSPP)圖庫集。Wang等人[17]假設不同的人之間共享相似的類內變化,據此利用泛型集估計類內散度。基于表示的算法包括擴展的SRC(ESRC)[12]、疊加SRC(SSRC)[18]、稀疏變化字典學習(SVDL)[13]、協同概率標簽(CPL)[19]等。盡管這些算法可以在一定程度上提高單樣本人臉識別算法的性能,但其性能仍嚴重依賴于巧妙的選取泛型集,理想的泛型集通常包括兩個特點:需與訓練樣本有相似的拍攝場景;需包含足夠的面部變化來預測測試樣本中未知的變化。然而實際中很難收集到足夠多的滿足上述條件的泛型集。
局部算法利用局部面部特征識別測試樣本。通常生成局部特征的方法是將一張人臉樣本分割成一些重疊或不重疊的圖像塊,因此該類型的局部算法通常被稱作基于塊的方法[20]。該類方法中每個被劃分的塊都被看作是這個人的獨立樣本,基于該假設,研究人員將傳統的子空間學習和基于表示的分類算法(例如PCA,LDA,SRC,CRC)進行擴展得到對應基于塊的算法,例如塊PCA[21],塊LDA[22],塊SRC(PSRC)[9]和塊CRC(PCRC)[20],整合每個塊的識別結果,得到最終的單樣本人臉識別結果。Lu等人[14]提出一種判別性多流行學習算法(DMMA),將人臉識別轉換成域到域的匹配問題。基于這一工作,Yan等人[23]通過整合多個局部特征提出多特征多流形學習方法來提升人臉識別性能。Zhang等人[21]通過加入另一個基于稀疏圖的Fisher準則修正了DMMA算法,并為被劃分出來的塊學習一個判別性子空間。
最近,有研究人員嘗試將泛型學習整合到基于塊的方法中用于單樣本人臉識別。例如,Zhu等人[24]從泛型集中提取塊變化字典,然后將其與訓練塊字典串聯來度量每個測試塊的表示殘差。這類算法與現有的基于塊的表示方法相比可在單樣本人臉識別中獲得更好的性能,但理想的泛型集的獲取仍是實際應用中的難題。
本文將樣本投影到頻域空間以實現樣本的擴充,同時采用通用訓練集采集部分類內變化信息,減小類內變化導致的單樣本識別率下降現象,最后將空頻域的識別結果進行融合獲得最終的識別結果并在數據集上驗證。
1 相關工作
1.1 深度稀疏自編碼網絡
SSAE是一種無監督特征學習算法,該算法采用層級訓練方案構造深度網絡,每一層包含兩個部分,即編碼器和解碼器。編碼器為一個函數,可將輸入向量x映射到隱藏層表示a,即。解碼器將隱藏層表示映射成一個重構向量y,即。其中W(1)和W(2)分別表示輸入到隱藏層及隱藏層到輸入的權重;b(1)和b(2)分別表示隱藏層單元和輸出層單元的基;f(·)表示隱藏層單元的激活值,一般選用sigmoid函數;g(·)表示輸出單元的激活值,一般設置為g(x)=x。對SSAE每層訓練即最小化該層損失函數J:
式中:x(i)表示第i個訓練樣本,同時也是期望輸出;y(i)表示對應預測輸出;m表示訓練樣本的個數;h表示隱藏層單元的個數。相對熵懲罰項是為了增強隱藏層的稀疏度,參數表示第j個隱藏單元在訓練集上的平均激活度,而ρ表示稀疏度參數,其值接近0,采用反向傳播算法進行訓練。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >