Wednesday, May 27, 2015

Week 04: Iterative Quantization: A Procrustean Approach to Learning Binary Codes

題目:Iterative Quantization: A Procrustean Approach to Learning Binary Codes


作者:Yunchao Gong and Svetlana Lazebnik 

            Department of Computer Science, UNC Chapel Hill, NC, 27599.


文章概要:


           本篇文章提出了在大規模圖像識別當中根據相似度進行二元編碼,從而進行有效率的檢索的問題,文章的核心是進行編碼,利用此編碼最小化quantization錯誤,節省空間。文章首先利用PCA(principle component analysis)對unsupervised 資料學得了較好的binary code,然後進一步最小化quantization error,利用CCA(canonical correlation analysis)對supervised data進行clustering,即本文提出的新方法,ITQ(iterative quantization),具體細節在主要算法中介紹。


主要算法:


           (1)Unsupervised Code Learning,首先利用線性轉換降低資料的維度,然後在該空間里使用binary quantization。降維即使用PCA,利用公式1和公式2,輸出結果即是降維的結果。然後公式1和公式2進行迭代,從而獲得最佳降維和編碼效果。                                                                  
公式1

公式2

          (2) Leveraging Label Information,此種方法主要結合了label當做supervised的方法,然後同樣進行iterative quantization,獲得最新的編碼。

實驗結果:


             文章主要在兩個數據集上進行evaluate,第一個是CIFAR dataset,它包含一共11個類別的64800張圖片,結果如圖1所示。第二個是共有580,000張的tiny images,結果如圖2所示。



圖1 CIFAR dataset 64800 result圖


圖2 CIFAR dataset 580000 result圖


          加上 Label后的效果如圖3所示。

 


圖3  Leveraging Label Information 影響圖


          最後作者展示了他們方法在sample query上的效果,可以較為清楚的看到當包含labels后,結果更有效和有意義。如圖4所示。



圖4  Leveraging Label Information后query效果圖 



創新之處和心得:


            本文著重點在於有限硬件條件下圖片的編碼,並且在此基礎上不會降低準確率,是一篇值得參考的文章。




No comments:

Post a Comment