近年來,隨著人工智能技術的發展,步態識別開始應用在公共場域身份識別中。步態識別,俗稱“走姿”識身份,不同人的“走姿”是不一樣的,走姿是人的“另一種身份”。另外,人在不同場域的步態也是不一樣的,比如在超市裡購物步伐偏慢,而在火車站趕車步伐急促,所以跨域步態識別為“走姿”識身份增加瞭難度。
據瞭解,目前普遍使用的深度學習算法依賴數據標註,換言之,通過步態識別誰是誰,首先得在數據庫裡知道具體的步態是怎樣的。這意味著,標註的準確性和數量直接影響著最終的識別精度。在實際應用中,人們往往受限於這種既昂貴又費時費力的數據標註上。如果數據庫裡沒有具體人的標註數據,那怎麼辦?
為此,鄭錦凱提出可遷移鄰域發現算法,首先找出高置信度樣本,並通過最近鄰算法找出這些樣本的領域樣本,之後通過損失函數拉近高置信度樣本與其領域樣本在特征空間中的距離,采用從易到難、循序漸進的方式更新深度學習模型。整個過程由近到遠、由易到難、由已知到未知,逐漸識別“哪些步態是誰的”,從而鎖定目標人物。
什麼是可遷移鄰域發現算法?鄭錦凱打瞭個比方:“如果想讓一個小孩識別國內的動物種類,你會給他一些動物圖片和對應的動物名字。通過學習,小孩能認出許多動物。你可能覺得還不夠,希望小孩能識別國外的動物,於是給小孩一些國外動物的圖片,讓他把屬於同一物種的圖片都放到一起進行分類。”
他進一步解釋道,由於小孩之前學習瞭很多國內的動物,一開始會比較順利,能夠挑選出一張或者幾張長得最像老虎的放一組,像獅子的放一組,等等。接著,小孩可能會繼續尋找那些還長得比較像老虎、獅子等的圖片,直到他再也找不到自己學過的圖片之後,他發現剩餘那些之前沒見過的圖片裡,有好幾張長得很類似,於是猜測它們屬於一個新物種。小孩可能同時發現好幾個新物種,把它們分別放一組,接著繼續尋找和這些新物種長得很像的圖片。
“可遷移鄰域發現算法模擬瞭上述一過程,直到所有圖片都被找完為止。”鄭錦凱告訴《中國科學報》:“可遷移鄰域發現算法與傳統聚類賦偽標簽識別不一樣,有望在步態識別領域拓展新的應用。(沈春蕾 程振偉)
相關論文信息:https://arxiv.org/abs/2102.04621
留言列表