2008年2月20日水曜日

2010年代の情報検索技術に向けて

ネット上の情報量は、倍々ゲームで増えているといわれる。また、検索の精度はだんだん下がっていくと思われる(実際にすでにそんな感覚がある)。本当に必要な情報にたどり着く前に、ブログやコメント、twitter的な情報、2次情報、3次情報、引用などが増えたために除外しなければならない情報、重複した情報が、加速度的に増えている。

2000年代初頭まで(おおざっぱに言ってBlog普及時前まで)は、ウェブにはそれなりの情報のみが存在していて、たとえば「ページランク」という技術でで有効に情報をフィルタリング・ランキングできたが、現在は、情報の純度は下がる一方である。

そのため、10年後には、ネットで知りたい情報を探す手段としては、GGL等の検索サイトが主流たり得ない気がする。

検索エンジンには世代があるが、(GGLは確か第3世代?)、さらなる進化が必要なのは必然である。

方向性は2つあると考える。

(1)今の検索エンジンベースで、キーワードを如何に確実に、効率よいものを探すかを
アシストする機能

(2)ページのランク付けに関しての、進化したロジック

業界では、(2)の研究が盛んなようなので、(1)に興味がわくところである。

0 件のコメント: