「Webサイトの継続的改善」のための手段として、「アクセスログ解析」をもっと有効に活用しましょう!このコーナーでは、「アクセスログ解析」を行うための手引き、分析方法や結果の活用方法などを、わかりやすく説明していきます。
2005年09月30日
ログファイルの入手とログのフォーマット
今回はログファイルの入手について書いてゆきます。
WWWサーバーの設置形態は、大きく分けて、自社で保存するか、外部のサーバー運営会社に保存するかのどちらかです。それぞれについて書きながら、出力されるログのフォーマットにも若干触れてゆきます。
自社で構築しているWWWサーバーからログを入手する
まず自社でWWWサーバーを構築している場合には、ログファイルの入手自体はそう難しいことではないでしょう。サーバー管理者に依頼して、ログファイルを入手しましょう。ただし、良いログが入手できるかどうか、それが問題です。ログファイルには、いくつかのフォーマットがあり、それはWWWサーバーの設定で決まります。
とは言え、最初はとにかくログの入手さえできれば問題ありません。まずは入手できるだけのログファイルを入手します。その上でサーバーの管理者には、ログのフォーマットについて、もし以下のようになっていなかったら、設定の変更を是非ともお願いしたいところです。
- Apacheの場合
- combined log format(結合ログ方式)でログを保存する。
- 詳しい情報は、Apacheの技術情報を参照して下さい。
- IISの場合
- 「W3C拡張フォーマット」で、「履歴」「Cookie」「ユーザーエージェント」を追加して保存する。詳しい情報は、 Microsoftの技術情報を参照して下さい。
なお解析に利用するデータの期間については、特に決まりはありませんが、1ヵ月でログファイルの解凍後サイズが20GB程度であれば、1ヵ月分を入手しましょう。もしそれ以上であれば、データの量に応じて、もう少し期間を少なくしても良いでしょう。
サーバーをレンタルしている場合のログの入手
サーバーをレンタルしている場合は、レンタルサーバー運営会社に依頼してログを入手することになります。あまり無いとは思いますが、ログデータの提供を行っていないというレンタルサーバー運営会社もあるかもしれません。その場合はアクセスログ取得型でのアクセス解析は諦めるしかありません。ただ、そんな会社では、サポートの面で心配だと言わざるを得ません。他にいくつもレンタルサーバー運営会社はあるのですから、運営会社の選定から見直しが必要です。
また、レンタルサーバー運営会社の場合、WWWサーバーとしてApacheを利用しているのがほとんどだと思われますので、combined log formatになっているかどうかの確認が必要です。こうなっていない会社も同様にサポート面で不安と言えます。
アクセス解析の重要性が高まるにつれて、ログ保存の重要性は高まっていくと言えるでしょう。アクセス解析からWebサイト改善を図りたいという考えがあるのであれば、出力してくれるログの質にこだわって、レンタルサーバーの運営会社を選定しましょう。
次回は、アクセス解析ツールの評価版のダウンロードについて書いてゆきます。