「Webサイトの継続的改善」のための手段として、「アクセスログ解析」をもっと有効に活用しましょう!このコーナーでは、「アクセスログ解析」を行うための手引き、分析方法や結果の活用方法などを、わかりやすく説明していきます。
2005年12月27日
自分のサイトが参照元になる現象と、「訪問」の定義の関係(1)
アクセス解析ツールで参照元の一覧を表示させたときに見られる現象としてもうひとつ特徴的なものに、参照元に自分のサイトが表れてしまう、というものがあります。参照元というのは基本的には外部のリンク元URLが表示される筈です。しかし、自分のサイトが参照元になってしまうことがあるのです。
このような現象が起きるのは、アクセス解析ツールでの「訪問」の概念の解釈の仕方に原因があります。そのため、まずこのエントリーで、「訪問」とはどのようば定義なのかを確認します。
「訪問」とは、サイト内のページに入り、出て行くまでの一連の行動の単位を意味します。といっても、アクセスログには、訪問別に整然とデータが保存されている訳ではありません。アクセスログファイルに残された記録から、どのページへのアクセスと、どのページへのアクセスが同一の訪問なのかを識別する必要があります。その方法として、大きく分けて下記2つの方法があります。
- IPアドレスとユーザーエージェントの組合せによる識別
- クッキーやセッションIDなどの識別子による識別
そして、ともに30分という制限時間内(解析ツールのデフォルト設定)にアクセスがなければ、その訪問は一度終了したものとみなしています。
少し考えればわかるように、これは一般的に我々が思い浮かべたときの「訪問」という行動とはズレがあることがわかります。IPアドレスとユーザーエージェントの組み合わせだけで同じ訪問によるアクセスだと言えるのか、また、一定時間ページを移動しないことで、訪問を終了したものとみなしてよいのか等、疑問は残ります。
しかし逆に考えると、どこからどこまでをひとつの「訪問」と考えて、それを別の「訪問」と切り離すかということは、厳密に考え出すときりがないとも言えます。解析ツールもプログラムですから、あいまいな解釈はできません。よって、このようにある程度「みなし」の要素が入ってくることは止むを得ないものです。また、この「訪問」という指標をつくることで、アクセス解析でわかることが大きく広がるのも間違いありません。
とはいえ、こうした定義の仕方のために、一見不可解な現象が起きるのは事実です。次回のエントリーで、この訪問の定義が、なぜ「自分のサイトが参照元になる」という現象を起こすのかを見てゆきます。