AMMAI course 2015: Week 04: Iterative Quantization: A Procrustean Approach to Learning Binary Codes

Wednesday, May 27, 2015

Week 04: Iterative Quantization: A Procrustean Approach to Learning Binary Codes

題目：Iterative Quantization: A Procrustean Approach to Learning Binary Codes

作者：Yunchao Gong and Svetlana Lazebnik

Department of Computer Science, UNC Chapel Hill, NC, 27599.

文章概要：

本篇文章提出了在大規模圖像識別當中根據相似度進行二元編碼，從而進行有效率的檢索的問題，文章的核心是進行編碼，利用此編碼最小化quantization錯誤，節省空間。文章首先利用PCA（principle component analysis）對unsupervised 資料學得了較好的binary code，然後進一步最小化quantization error，利用CCA（canonical correlation analysis）對supervised data進行clustering，即本文提出的新方法，ITQ（iterative quantization），具體細節在主要算法中介紹。

主要算法：

（1）Unsupervised Code Learning，首先利用線性轉換降低資料的維度，然後在該空間里使用binary quantization。降維即使用PCA，利用公式1和公式2，輸出結果即是降維的結果。然後公式1和公式2進行迭代，從而獲得最佳降維和編碼效果。

公式1

公式2

（2） Leveraging Label Information，此種方法主要結合了label當做supervised的方法，然後同樣進行iterative quantization，獲得最新的編碼。

實驗結果：

文章主要在兩個數據集上進行evaluate，第一個是CIFAR dataset，它包含一共11個類別的64800張圖片，結果如圖1所示。第二個是共有580,000張的tiny images，結果如圖2所示。

圖1 CIFAR dataset 64800 result圖

圖2 CIFAR dataset 580000 result圖

加上 Label后的效果如圖3所示。

圖3 Leveraging Label Information 影響圖

最後作者展示了他們方法在sample query上的效果，可以較為清楚的看到當包含labels后，結果更有效和有意義。如圖4所示。

圖4 Leveraging Label Information后query效果圖

創新之處和心得：

本文著重點在於有限硬件條件下圖片的編碼，並且在此基礎上不會降低準確率，是一篇值得參考的文章。

No comments:

Post a Comment

Subscribe to: Post Comments (Atom)