PageRank for product image search


**従来の画像検索

メタ情報に対する検索。従来の情報検索で研究されており、かなり成功する応用例もある。例:Googleの画像検索。

**従来の画像が失敗する例

マクドナルドのロゴを知りたい。ビッグMを見つけたいのに、マクドナルド関連のさまざまなノイズを拾ってしまう。((論文に書かれているようにMcDonaldで検索するとロゴを含んだ画像が少ないのだけれども、「McDonald logo」をキーワードに選ぶと案外うまくいってたりするから、論文の筆者は自分たちに都合のよい例をつかっていると考えてよい。))

**Image Rank: 画像の類似性を計算してみる。

画像を含んだページが、別のページへのリンクを含み、そのページに画像が含まれる場合に、ページ間の関係を有向グラフとしてモデルし、グラフのエッジに両ページに含まれる画像の類似性を与える。

類似性の解析にはSIFTアルゴリズムを用いる。回転、スケール、照明変化に関する類似性を判定する。((つまりアフィン変換一般を扱える))

– 二つの画像の類似度 = 一致する特徴点の個数/二つの画像の特徴点の数の平均

**応用

+モナリザ: モナリザにはいろいろなパロディがあるが、中心には原画がくるのか
–S君のツッコミ:同じページにモナリザの写真が二枚あったときに、Google画像検索はどちらも候補として提示するのか?I君の答え:たぶん、Google画像検索は各ページからひとつしか表示しれくれない。← へぇ〜、知らなかった!
+「モネ」で検索したときに、作品ごとにクラスタに分離できる。ルノワールが描いた「Argenteuilの庭で描くモネ」も見つかる。ImageRankの結果、ルノワールが描いたもののランクが高いのは問題だ。

**評価

-Google Product Searchでヒット数の多かった製品トップ2,000についての画像検索で、ImageRankとGoogle Image Searchを適用し、キーワードとの関連について被験者に評価してもらった。

**今後の課題