論文 個人適応型クエリ推薦

題名

HITSに基づくWikipedia ランキングアルゴリズムとユーザ履歴を用いた個人適応型クエリ推薦
http://www.ieice.org/~de/DEWS/DEWS2008/proceedings/files/b2/b2-4.pdf

著者

NTT のサイバーソリューション研究所

手法の概略

キーワード重要度を算出して、キーワード重要度が高いものをユーザに推薦する。

キーワードは Wikipedia の見出し語をそのまま流用。

キーワード重要度には、ユーザに依らない普遍的な固有重要度とユーザ毎に変化するユーザ毎重要度からなる。

   キーワード重要度 = 固有重要度 + ユーザ毎重要度

固有重要度

Wikipedia のリンク構造を利用した HIT 数をもとに算出。
基本的には、 authority の計算には Wikipedia のテキスト量、hub の計算にはリンク数と被リンク数を用いている。
但し、Wikipedia 特有の問題からそれぞれ補正をかけている。

ユーザ毎重要度

ユーザが見たページから抽出されたキーワードは高く設定。
その際に、閲覧時間と局所性を考慮。
それだけ。

結果と考察

それなりに良いキーワードを推薦できた。
Wikipedia の見出し語をキーワードとして用いるので、ユーザの興味を幅広く網羅できている。
しかし、ユーザの嗜好は思ったよりも複雑で、興味の粒度も細かい。