ミツエーリンクス

アクセス解析Blog

Home > メソッド > アクセス解析Blog > 参照元が自分のサイトになってしまう現象(2)

「Webサイトの継続的改善」のための手段として、「アクセスログ解析」をもっと有効に活用しましょう!このコーナーでは、「アクセスログ解析」を行うための手引き、分析方法や結果の活用方法などを、わかりやすく説明していきます。

2006年01月10日

参照元が自分のサイトになってしまう現象(2)

2006年第1回目のエントリーです。今年も宜しくお願いします。

さて、前回のエントリーでは、「参照元が自分のサイトになってしまう現象」の原因として「訪問」という概念の解釈の仕方に問題があることを指摘し、実際に訪問という概念がどのように定義されているかまで確認しました。

今回のエントリーでは、そのように訪問を定義すると、なぜ「参照元が自分のサイトになってしまう現象」が起きてしまうのかを説明します。

まずは要領をつかむために、訪問の定義にもとづき、アクセスログを訪問の単位に分ける簡単な例を示します。仮に以下のアクセスログをもつサイトを(サイトA)とすると、

日時 IPアドレス ユーザーエージェント アクセスしたファイル 参照元
2006/1/10 12:00 1.22.33.44 Mozzila 4.0 /index.html -
2006/1/10 12:01 9.88.77.66 Opera /product1/main.html http://www.yahoo.co.jp/
2006/1/10 12:02 1.22.33.44 Mozzila 4.0 /product3/main.html http://(サイトA)/index.html
2006/1/10 12:04 9.88.77.66 Opera /product2/main.html http://(サイトA)/product1/main.html
2006/1/10 12:06 1.22.33.44 Mozzila 4.0 /service/index.html http://(サイトA)/product3/main.html

以下のようにAとBという2つの訪問データに分けることができます(訪問の識別は、IPアドレスとユーザーエージェントを用います)。

訪問 日時 IPアドレス ユーザーエージェント アクセスしたファイル 参照元
A 2006/1/10 12:00 1.22.33.44 Mozzila 4.0 /index.html -
A 2006/1/10 12:02 1.22.33.44 Mozzila 4.0 /product3/main.html http://(サイトA)/index.html
A 2006/1/10 12:06 1.22.33.44 Mozzila 4.0 /service/index.html http://(サイトA)/product3/main.html
B 2006/1/10 12:01 9.88.77.66 Opera /product1/main.html http://www.yahoo.co.jp/
B 2006/1/10 12:04 9.88.77.66 Opera /product2/main.html http://(サイトA)/product1/main.html

では、以下のような場合はどうでしょうか?

日時 IPアドレス ユーザーエージェント アクセスしたファイル 参照元
2006/1/10 12:00 1.22.33.44 Mozzila 4.0 /index.html -
2006/1/10 12:01 9.88.77.66 Opera /product1/main.html http://www.yahoo.co.jp/
2006/1/10 12:02 1.22.33.44 Mozzila 4.0 /product3/main.html http://(サイトA)/index.html
2006/1/10 12:04 9.88.77.66 Opera /product2/main.html http://(サイトA)/product1/main.html
2006/1/10 12:40 1.22.33.44 Mozzila 4.0 /service/index.html http://(サイトA)/product3/main.html

訪問の分け方は先程と同様です。しかし今回は、1.22.33.44とMozzila 4.0という同じIPアドレスとユーザーエージェントの組み合わせによるアクセスで、時間間隔が30分以上空いているものがあります。このアクセスは、実際には1つのブラウザで行われたもので、食事か何かで少しの間、席を空けていただけでした。しかし、訪問の分け方には、「ページのアクセスの間隔が30分を超えたら、別の訪問とする」というルールがあります。よって、訪問は、以下のように、A1、A2、Bという3つに分かれます。

訪問 日時 IPアドレス ユーザーエージェント アクセスしたファイル 参照元
A1 2006/1/10 12:00 1.22.33.44 Mozzila 4.0 /index.html -
A1 2006/1/10 12:02 1.22.33.44 Mozzila 4.0 /product3/main.html http://(サイトA)/index.html
A2 2006/1/10 12:40 1.22.33.44 Mozzila 4.0 /service/index.html http://(サイトA)/product3/main.html
B 2006/1/10 12:01 9.88.77.66 Opera /product1/main.html http://www.yahoo.co.jp/
B 2006/1/10 12:04 9.88.77.66 Opera /product2/main.html http://(サイトA)/product1/main.html

このとき、A2の訪問の参照元は、何の問題もなくリンク元である自分のサイト(この場合は、http://(サイトA)/product3/index.html)になります。このように、ページのアクセスの間隔を30分以上空けて次のページを閲覧することが、参照元が自分のサイトになってしまう現象が起きてしまう第1の原因です。なお、この30分という時間は、解析ツールのデフォルト設定なので、もっと間隔を長くすることもできます。間隔を長くすることで、ある程度現象を回避することができます。しかし、あまりに長くしすぎると、別の訪問とみなすべきアクセスまでひとつの訪問にまとめかねないので、注意が必要です。

第2の原因は、クライアント側の接続形態として、複数のProxyを利用していた場合です。1人の訪問者が、1つのPC、1つのブラウザを用いていても、複数のProxyを利用していると、ページにアクセスする度にIPアドレスが変わってしまうため訪問が分けられてしまい、その都度参照元が自分のサイトとなってしまいます。例えば、以下のような場合です。

訪問 日時 IPアドレス ユーザーエージェント アクセスしたファイル 参照元
A1 2006/1/10 12:00 1.22.33.44 Mozzila 4.0 /index.html -
A2 2006/1/10 12:01 1.22.33.45 Mozzila 4.0 /product1/main.html http://(サイトA)/index.html
A3 2006/1/10 12:02 1.22.33.46 Mozzila 4.0 /product2/main.html http://(サイトA)/product1/main.html

これを回避するためには、訪問の識別として「IPアドレスとユーザーエージェント」による組み合わせに頼るのではなく、Cookieなどを用いてもっと厳密な識別を用いることです。但し、これを用いたとしても、Cookieを無効にしたブラウザからのアクセスでは正しく訪問を分類できませんし、上記した第1の原因から逃れられる訳でもありません。

このように、参照元が自分のサイトになってしまう現象は、完全には回避できるものではありません。経験的には、参照元の5%程度が自分のサイトになるのは、止むを得ないと考えています。ただ、5%よりも数値が断然大きいようなら、上記2つの原因を見直して、修正が必要だと考えます。

バックナンバー

プライバシー&サイトポリシーCopyright (c) 2011 Mitsue-Links Co.,Ltd. All Rights Reserved.

Web制作、ホームページ作成、Flash制作:Webサイト構築、Webサイト運用:ブロードバンドコンテンツ(音声制作、動画制作):システム開発、Webマーケティング、Webブランディング、Webコンサルティング・・>のWeb Integrationならミツエーリンクスにお任せください。