「Webサイトの継続的改善」のための手段として、「アクセスログ解析」をもっと有効に活用しましょう!このコーナーでは、「アクセスログ解析」を行うための手引き、分析方法や結果の活用方法などを、わかりやすく説明していきます。
2005年09月30日
ログファイルの入手とログのフォーマット
今回はログファイルの入手について書いてゆきます。
WWWサーバーの設置形態は、大きく分けて、自社で保存するか、外部のサーバー運営会社に保存するかのどちらかです。それぞれについて書きながら、出力されるログのフォーマットにも若干触れてゆきます。
自社で構築しているWWWサーバーからログを入手する
まず自社でWWWサーバーを構築している場合には、ログファイルの入手自体はそう難しいことではないでしょう。サーバー管理者に依頼して、ログファイルを入手しましょう。ただし、良いログが入手できるかどうか、それが問題です。ログファイルには、いくつかのフォーマットがあり、それはWWWサーバーの設定で決まります。
とは言え、最初はとにかくログの入手さえできれば問題ありません。まずは入手できるだけのログファイルを入手します。その上でサーバーの管理者には、ログのフォーマットについて、もし以下のようになっていなかったら、設定の変更を是非ともお願いしたいところです。
- Apacheの場合
- combined log format(結合ログ方式)でログを保存する。
- 詳しい情報は、Apacheの技術情報を参照して下さい。
- IISの場合
- 「W3C拡張フォーマット」で、「履歴」「Cookie」「ユーザーエージェント」を追加して保存する。詳しい情報は、 Microsoftの技術情報を参照して下さい。
なお解析に利用するデータの期間については、特に決まりはありませんが、1ヵ月でログファイルの解凍後サイズが20GB程度であれば、1ヵ月分を入手しましょう。もしそれ以上であれば、データの量に応じて、もう少し期間を少なくしても良いでしょう。
サーバーをレンタルしている場合のログの入手
サーバーをレンタルしている場合は、レンタルサーバー運営会社に依頼してログを入手することになります。あまり無いとは思いますが、ログデータの提供を行っていないというレンタルサーバー運営会社もあるかもしれません。その場合はアクセスログ取得型でのアクセス解析は諦めるしかありません。ただ、そんな会社では、サポートの面で心配だと言わざるを得ません。他にいくつもレンタルサーバー運営会社はあるのですから、運営会社の選定から見直しが必要です。
また、レンタルサーバー運営会社の場合、WWWサーバーとしてApacheを利用しているのがほとんどだと思われますので、combined log formatになっているかどうかの確認が必要です。こうなっていない会社も同様にサポート面で不安と言えます。
アクセス解析の重要性が高まるにつれて、ログ保存の重要性は高まっていくと言えるでしょう。アクセス解析からWebサイト改善を図りたいという考えがあるのであれば、出力してくれるログの質にこだわって、レンタルサーバーの運営会社を選定しましょう。
次回は、アクセス解析ツールの評価版のダウンロードについて書いてゆきます。
恒久リンク | コメント [0件] | 関連情報(トラックバック) [0件]
2005年09月26日
アクセス解析で使われるツール
アクセス解析のツールは大きく分けて3種類
まずはじめに、アクセス解析を行うために、どのようなツールがあるのかを確認します。アクセス解析を行うためのツールは、大きく以下3つに分類できます。
- (1)アクセスログ取得方式
- これは、WWWサーバに保存されたログファイルを解析する方法です。ツールをインストールして、ログファイルを読み込んで分析する、という解析の方法が一般的です。種類としては最も多く出回っており、評価版が利用できる場合が多いです。主なツールは、SiteTrackerやeIQ、Urchin、ClickTracks、WebTrendsなど。また、WWWサーバにインストールして利用するAnalogやWebalizerといったフリーのツールもあります。
- (2)スクリプト利用方式
- これは、主にASPサービスによって提供されるもので、サイト内のページ毎に何らかのスクリプトを書き込んでおき、そのページがアクセスされる毎に、そのASPサービスのサーバにデータを残すものです。主なツールにVisionalist、サイトセンサス、シビラ、サイトインテリジェンス、WebMKなど。また個人ユースに近い廉価版では何と言っても、忍者ツールズ、またインフォシークアクセス解析なども有名どころです。
- (3)パケットキャプチャリング方式
- これは、WWWサーバへ流れるトラフィックを、特殊なコントローラによってキャプチャし、アクセスのデータを読み取るものです。ここはRTMetricsの独壇場です。
アクセス解析というと、(1)のタイプのツールを想像する方が多いと思いますが、実はそれだけではないのです。特に(2)は、普及率も高いです。それぞれ長所・短所がありますが、それについては今述べるよりも、本当の意味でのアクセス解析を経験してからの方が実感が湧くと思いますので、今は触れません。実際にどのツールを導入するか検討する上では、「(1)か(2)」、または(3)という選択になると思います。ただ、最近の潮流として、(1)のツールが、(2)の機能を取り込んでいるものもあります。(3)はオールマイティなのですが、導入までの費用が高額で大規模サイト向けと言えます。そのため、パケットキャプチャリング型のアクセス解析を行う際には、導入費用が重要な要素となります。
今すぐアクセス解析を始めるなら「アクセスログ取得型」から
今は、「まずアクセス解析をやってみる」ということを重点に置いています。
そのため、今すぐにでもアクセス解析ができるツールを選びたいものです。そのことを考えると、採用するツールは、自動的に「アクセスログ取得型」に決まってしまいます。
なぜなら、パケットキャプチャリングのためのコントローラーはかなり高価ですし、ASP型アクセスログ解析は、スクリプトをサイト内のページに張り巡らせるという作業が必要です。そして、どちらのツールにしても、準備が完了してからデータの収集を始めるので、必要なデータが貯まるまでに、ある程度の期間がかかってしまいます。
その点、「アクセスログ取得型」は、今あるログファイルをもとに分析することができます。また、どのツールも評価版を用意しています。今からアクセス解析をこれから始める人、アクセス解析を本格的に導入したいが、その予算が付けるためになるべく安価に有効性を示したいと考えているWeb管理者にとって、導入するのに最もハードルの低いツールだと言えるでしょう。
次回はログファイルについて見てゆきます。
参考文献:Web Master完全ガイド vol.01 インプレス
恒久リンク | コメント [0件] | 関連情報(トラックバック) [0件]
2005年09月07日
どこからアクセス解析を始めるか
このアクセス解析Blogは、ある程度回数を重ねるまでは、読者の対象を、
- アクセス解析をやったことがない
- アクセス解析をやっていることはやっているが、アクセスが上がった下がった以外に特徴を見出せない
といった、アクセス解析に不慣れなWeb管理者を想定しています。そして、そういった方々が、アクセス解析に興味をもち、より活用していただくことを、この間の目的としたいと考えています。
まず、アクセス解析に不慣れなWeb管理者にとって、最初の障害となるのが、どこからアクセス解析を始めれば良いのか?ということです。
もちろん、アクセス解析を行うのは、その結果をもとにWebサイトの改善を行うためです。その改善までのプロセスとしてアクセス解析を用いて、「仮説を立てて実践し、その結果を検証して、また仮説につなげる」というサイクルを回すのは重要なことです。ただ仮説を設定するためには、アクセス解析から問題点を抽出しなければいけません。
そして問題点を抽出するためには「問題意識をもって、サイトの構築目的と現実のギャップを認識する」ということが重要になるのですが、実はこれも言うほど簡単な話ではありません。なぜなら、サイトの構築目的が明確だったとしても、現実を的確にとらえることができなければ、問題点を明らかにすることができない、あるいは間違った問題点の指摘をすることにもなりかねないからです。
よって、アクセス解析をはじめて行うのであれば、現実を的確にとらえることを、まず心掛けて下さい。現実のとらえ方はさまざまで、とらえ方によって見える現実が見えなくなったり、見えなかった現実が見えるようになります。アクセス解析自体と、そのツールに慣れてさまざまなことができるようになると、さまざまな視点から現実を見ることができるようになります。実は、それができるようになれば、問題意識も自在に操れ、仮説検証型のプロセスもしっかり管理できるようになります。しかし、まずはそのための第一歩、現実をとらえるための基本は、実はどこのサイトでも変わりません。次回以降で、アクセス解析に関して最低限必要となる知識を説明した後、「現実をとらえる」ための基本的な手法をご紹介したいと思います。