5月21日にテスト版ながらスタートしたHotBotは,以前 Inktomi といわれた検索エンジンの発展したものです。カリフォルニア大学のコンピュータセンターのプロジェクトで開発されていたものですが,ニュースやエンターテイメントの世界で有名なベンチャー企業 HotWired と共同で新たに HotBot として誕生。2日目にアクセス数の増大のためダウンしていましたが,現在は検索でき,当巡回検索も使用できます。
早速,検索調査を行いました。AltaVista を目標にしているということで,両者に同じ検索を行い,その検索数を比較しました。HotBot はキーワードを入力し,検索ボタンを押すと新しいウィンドウにカラフルな結果が総数と共に表示されます。一方の AltaVista は Advances Searchを呼び出し,Count Only をチェックし,キーワードを入力し検索ボタンを押すと左下に総数が表示されます。得られた検索数と倍率を示しますと,
Keyword | HotBot | AltaVista | Hot/Alta |
biology | 353,817 | 310,582 | 1.139 |
hardware | 811,434 | 662,770 | 1.224 |
healthcare | 72,221 | 61,964 | 1.166 |
holiday | 216,577 | 190,491 | 1.137 |
literature | 498,698 | 419,583 | 1.189 |
market | 1,096,022 | 958,272 | 1.144 |
movie | 443,130 | 371,604 | 1.192 |
museum | 405,918 | 351,226 | 1.156 |
outdoor | 179,109 | 151,965 | 1.179 |
photography | 190,827 | 163,349 | 1.168 |
technology | 2,123,182 | 1,769,676 | 1.200 |
average | 580,994 | 491,953 | 1.172 |
任意に選んだキーワードですが,すべてのキーワードで HotBot の検索数は多く,平均して17%多いことが分かりました。公表された HotBot の総ページ数は 3,800万頁で,今後2週間位で5,000万にするとのことですから,AltaVista の増加がなければ,その差は拡大し約50%になります。すなわち,HotBot3に対して,AltaVista 2になります。Net News や mailing lists のサービスもまもなく始めるとのことで,やはり,世界一の検索サービスが登場したことになります。
Web情報の検索サービスの初期タイプのものは単語の語尾変化を取り込んでいます。例えば,Lycos で market を検索しますと,market,marketing,markets などが一緒に検索されます。このタイプの検索システムは AND/OR検索ができません(Lycos, Magellan, Infoseek, Yahoo!)。
一方,単語の語尾変化を考慮しない検索システム(AltaVista,Open Text,WebCrawler)は market と markets を別々に処理するため AND/OR検索が可能です。HotBot の場合,market(1,096,022),markets(353,533),AND検索(197,690),OR検索(1,251,865)となり,market+markets=AND検索+OR検索 の式が成り立ちますので,AND/OR検索のチェックは見事にパス。それにしても100万以上のAND/OR検索ができるすばらしい世界です。
HotBotには様々な検索オプションが用意されています。期間の指定,ドメインの指定,あるいは地理の指定が可能です。さらに,Java,VRML,Acrobatなどメディアの指定もできます。この点,AltaVistaの機能の拡張も有用で,逆リンクなどの link: や host: など新しい利用法が考え出されています。
検索サービスの重要な点は網羅性と速報性です。現時点のHotBotは,Web情報の収集数は最大で,また新鮮さはクリアしており,この点からも世界最高の検索サービスとみなます。ロボットは1週間に1回訪問するので,新規にWeb頁として公開したものは,少なくとも1週間以内にデータベース化されます。AltaVista は5~7週間ですから1週間の更新は驚異的なものです。
昨年の12月15日に登場した AltaVista のトップの座は5ヶ月後の5月20日に HotBot に移りました。6月には Ultraseek のサービスが開始しますので,ロボットによる検索サービスは第2世代に移行したとみなせます。Web情報の増加はまだ続いており,現在の推定5,000万頁が,年内中に1億頁を越えるのは確実です。今後2年以内に20倍の10億頁になります。10億頁を処理する技術が出現しなければ,検索どころではなくなります。現時点で最高の技術を持つ HotBot,AltaVista,Infoseek に声援を送ることが大切なように思います。