「Webサイトの継続的改善」のための手段として、「アクセスログ解析」をもっと有効に活用しましょう!このコーナーでは、「アクセスログ解析」を行うための手引き、分析方法や結果の活用方法などを、わかりやすく説明していきます。
2005年11月30日
「参照元(リファラ)」について
前々回のエントリーでも触れましたが、「訪問の最初のページ」となる回数が多いページに関して、なぜそのページからの訪問が多いのかを調べるためには、「参照元(リファラ)」を調べる必要があります。参照元とは「そのページを訪れるときに用いられたリンクページのURL」を意味し、これを調べることで、どのページからのリンクでそのページに辿り着いたのかがわかります。
参照元となるURLは、WWWサーバの内外を問わず記録されています。そのため、例えば「トップページからナビゲーションの製品ページをクリックして移動する」というサイト内の移動を考えると、製品ページにとって参照元はトップページとなります。一方、WWWサーバ外にあるリンクから訪れた場合は、そのサーバ外のページのURLが参照元として残ります。
サーバ外にあるURLが参照元となる場合で特徴的なのは、ページに設けられている一般的なリンクだけでなく、検索エンジンの検索結果も参照元となることです。検索エンジンによる検索結果のURLは、下記のようにキーワードが機械語として残っています。参照元には、このデータがまるまる残るのです。もちろん、これを活用しない手はありません。アクセス解析ツールは、この機械語を自然語(日本語)に置き換え、サイト訪問の際に検索エンジンで利用されたキーワードを収集しています。
http://www.google.co.jp/search?hl=ja&q=Web+%E5%88%B6%E4%BD%9C&lr=
http://search.yahoo.co.jp/search?p=Web+%C0%A9%BA%EE&fr=top&src=top&search.x=17
&search.y=6
(上記は、googleとYahooで、「Web 制作」と検索したときに表示されるURLです。Webという1バイト文字は機械語にならず、制作という2バイト文字だけが機械語になっていることがわかります)
このように参照元を調べることで、どういったリンク元から訪問しているのか、さらに、検索エンジン経由の訪問が多い場合は、どんなキーワードが多く利用されているのか、といったことまでわかるのです。これは、個別のページの流入原因を特定するのにはもちろん、サイト全体の流入傾向を把握するのにも欠かせません。
しかし、もしログに参照元が残されていなかったら、こうしたことはいっさい謎のままです。以前に、「ログファイルの入手とフォーマット」というタイトルでエントリーを書きましたが、ログの保存形式によっては、この参照元がないことがあるのです。ログを保存するためのディスク容量は増えてしまいますが、ログの保存形式は必ず参照元を含ませるように設定しましょう。
恒久リンク | コメント [0件] | 関連情報(トラックバック) [0件]
2005年11月25日
アクセス解析セミナーを開催します
来る12月16日(金)、弊社の社内セミナーとして、アクセス解析セミナーを開催いたします。
11月28日に行われるアクセス解析カンファレンスや、Google Analyticsのリリースなど、アクセス解析を巡る話題はさらに盛り上がりを見せている感があります。特にGoogle Analyticsはリリース直後から申し込みが殺到したため、現在では新規申し込みがいったんストップされているほどです。
このセミナーでは、そのようなアクセス解析の最新動向から、ツール選定のためのポイント、有効な分析手法まで、アクセス解析に関する幅広いトピックをお伝えしたいと考えています。宜しければ、是非ご参加下さい。
恒久リンク | コメント [0件] | 関連情報(トラックバック) [0件]
2005年11月11日
「訪問の最初に訪れたページ」をアクセスマップに加える
アクセスマップを作成したときに、最も目にしやすい現象のひとつに、隣接する階層ページのページビューは少ないのに、特定の1ページのみ急激にページビューが多い、というものがあります。
このようなページが発生する原因を知るために、最終的に必要なのは、そのページのリンク元となったページを知ることです。つまりページごとの「参照元(リファラ)」調査です。しかし、個々のページに関してそれをひとつひとつ調べていくのは大変です。全体のアクセス状況を把握する、ということを目的とするなら、まずは「訪問の最初に訪れたページ」という指標を確認するのが効率的です。
例えば以下のように、この指標の回数が多ければ、外部サイトからの直接流入が多いことがわかります(太字が各ページの「訪問の最初に訪れたページ」を示しています)。
技術X 700PV 120回 | 技術Xの概要 600PV 80回 |
研究事例 500PV 100回 | |
詳しい理解のための用語集 2000PV 1600回 |
逆に以下のように回数が少なければ、サイト内のどこかのリンクからのアクセスが多いと言えます。
技術X 700PV 120回 | 技術Xの概要 600PV 80回 |
研究事例 500PV 100回 | |
詳しい理解のための用語集 2000PV 120回 |
いずれにしても、ここから先、どうしてこのページだけアクセスが多いのか、その原因を突き止める必要はあります。しかし、全体としてのアクセス状況を把握することを主眼に置くなら、この指標を使うのが効率的です。どんなアクセス解析ツールでも、この「訪問の最初に訪れたページ」の一覧が出力されますので、ページビューと同様、上記のようにアクセスマップに数字を記載してみましょう。そうすると、アクセス状況の概要が、さらに見やすくなってくるでしょう。
恒久リンク | コメント [0件] | 関連情報(トラックバック) [0件]
2005年11月02日
「ページごとのページビュー数」からサイト全体のアクセス状況を把握する(後編)
前回のエントリーで、「サイト全体のアクセス状況」を把握するためには、単にページごとのページビュー数を上位から一覧で表示するのではなく、サイトの構造で情報を整理して表現することで初めて可能になると述べました。
では実際に「サイトの構造で情報を整理しながら表現」するとどのように状況が変化するのか、架空のサイトを元にした例で見てみましょう。
第1階層 | 第2階層 | 第3階層 | 第4階層 |
---|---|---|---|
トップページ 20000PV | 製品情報 5000PV | 製品A概要 2000PV | 特長 1000PV |
価格 800PV | |||
よくある質問 300PV | |||
製品B概要 4000PV | 特長 3000PV | ||
価格 2200PV | |||
よくある質問 500PV | |||
技術情報 2500PV | 技術X 700PV | 技術Xの概要 600PV | |
研究事例 500PV | |||
詳しい理解のための用語集 2000PV | |||
技術Y 500PV | 技術Yの効果 300PV | ||
応用事例 200PV | |||
ニュース・イベント 8000PV |
新製品発表のご案内 5000PV | ||
イベント開催のご案内 7000PV | |||
会社案内 4200PV | 理解へのキーワード 1800PV | ||
会社概要 1500PV | |||
沿革 1100PV |
このように、階層構造でページを整理してアクセス数を示した表のことを、我々はアクセスマップと呼んでいます。トップページから、物理的なディレクトリ構造と、見た目の表示からページをひとつひとつ、漏れなく整理して作成してゆきます。情報設計がうまくいっているサイトであれば整理は比較的楽でしょう。うまくいっていなければ整理は難しいですが、妥当性のある範囲で無理やり収めてゆきます。
このアクセスマップを見れば、下記のような特徴(問題点)はすぐに見つけることができます。
- 第2階層のカテゴリの中では、ニュース・イベントのカテゴリが多く読まれている。
- 製品情報では、製品AよりもBの方が多く読まれている。
- どちらの製品情報も、「価格」ページ以下のページビュー数が極端に下がる。
- 技術情報の下層ページに多くのページビュー数を集める用語集ページが存在する。
こうした特徴は、ページビューの上位一覧を眺めているだけでは難しいでしょう。このマップで、こうした特徴を簡単に見つけることができるのは、マップ自体が、以下のような比較をするように、見る人を仕向けているからだと思っています。
- 各階層ごとのページビュー(PV)の比較
- 上位階層と下位階層のPVの比較
- 階層内の各ページのPVの比較
比較した見方をするので、特徴を見つけやすくなります。しかもそれが階層構造に結びついた見方なので、「サイト全体のアクセス状況」という大きな観点で見ることができます。そのため、アクセス解析をしたいけれども何から始めたら良いかわからない、という人は、このアクセスマップから始めてみましょう。必ずサイトに関する問題点を見付けることができるでしょう。また問題点の発見にとどまらず、より深い分析に入るきっかけにもなるでしょう。
今後のエントリーでも、機会を見て、サイトマップの部分を抜き出して、そこで起きている現象を、詰将棋の解説のように説明したいと思います。