題目:Iterative Quantization: A Procrustean Approach to Learning Binary Codes
作者:Yunchao Gong and Svetlana Lazebnik
Department of Computer Science, UNC Chapel Hill, NC, 27599.
文章概要:
本篇文章提出了在大規模圖像識別當中根據相似度進行二元編碼,從而進行有效率的檢索的問題,文章的核心是進行編碼,利用此編碼最小化quantization錯誤,節省空間。文章首先利用PCA(principle component analysis)對unsupervised 資料學得了較好的binary code,然後進一步最小化quantization error,利用CCA(canonical correlation analysis)對supervised data進行clustering,即本文提出的新方法,ITQ(iterative quantization),具體細節在主要算法中介紹。
主要算法:
(1)Unsupervised Code Learning,首先利用線性轉換降低資料的維度,然後在該空間里使用binary quantization。降維即使用PCA,利用公式1和公式2,輸出結果即是降維的結果。然後公式1和公式2進行迭代,從而獲得最佳降維和編碼效果。
(2) Leveraging Label Information,此種方法主要結合了label當做supervised的方法,然後同樣進行iterative quantization,獲得最新的編碼。
實驗結果:
文章主要在兩個數據集上進行evaluate,第一個是CIFAR dataset,它包含一共11個類別的64800張圖片,結果如圖1所示。第二個是共有580,000張的tiny images,結果如圖2所示。
圖1 CIFAR dataset 64800 result圖
圖2 CIFAR dataset 580000 result圖
加上 Label后的效果如圖3所示。
圖3 Leveraging Label Information 影響圖
最後作者展示了他們方法在sample query上的效果,可以較為清楚的看到當包含labels后,結果更有效和有意義。如圖4所示。
圖4 Leveraging Label Information后query效果圖
創新之處和心得:
本文著重點在於有限硬件條件下圖片的編碼,並且在此基礎上不會降低準確率,是一篇值得參考的文章。







No comments:
Post a Comment