2010年10月28日

HTTPヘッダーとRefererとグーグル検索URL訴訟

 Googleの検索結果ページで別のサイトへのリンクをクリックすると、検索に使用したキーワードがリンク先のサイトに漏えいするということで、集団訴訟が起きたそうです。このニュースは技術的にどういうことなのかを解説してみたいと思います。

グーグル、検索語含むURLの受け渡しが訴訟の標的に
http://japan.cnet.com/news/business/story/0,3800104746,20422043,00.htm

 今ではウェブページの規格通りにウェブブラウザーが解釈してくれる場合が多くなったため、どのブラウザーを使って表示してもだいたい同じような画面が表示されるようになってきました。しかし、ほんの少し前までは、使用するブラウザーが異なると、ページがかなり乱れて表示される場合がありました。ウェブブラウザーが規格通りに表示してくれば良かったのですが、なかなかうまくいかなかったのです。
人気ブログランキング
 ウェブサイトを作成する人にとって、これは悩みの種になります。同じウェブページであれば、どのウェブブラウザーでも同じように見えるよう、ウェブブラウザーを出している会社(団体)が作ってくれればいいですが、それはサイト制作者がどうにかできることではないのです。

 それでは何も手段がなかったかというと、そうではありません。一応の解決策が用意されていました。ウェブサイトを閲覧するには、ウェブブラウザーがウェブサーバーにURLを送信しますが、このとき、「HTTPヘッダー」と呼ばれる付加的な情報も送信しています。通常、HTTPヘッダーにはどのウェブブラウザーのどのバージョンを使っているという情報が含まれているので、ウェブサイト制作者は、その情報を見て、訪問者が利用してるブラウザーに合わせてページを表示すればいいのです。

 さて、HTTPヘッダーには「リファラー(Referer)」というものがあり、これもウェブブラウザーから送信されています。その内容は、直前に表示していたページのURLです。たとえば、もしこのブログのリンクをクリックすると、利用者のウェブブラウザーは、このブログのURLをRefererとしてリンク先サイトに送信するのです。ブラウザーが送信している情報ですからブログの管理人である私が制御することはできませんし、制御できてしまっては危険ですらあります。

 さて、冒頭のニュースに戻りましょう。Googleの検索結果のURLをよく見たことはあるでしょうか。Googleで「中級解説」を検索すると次のようなURLになります。

http://www.google.co.jp/search?source=ig&hl=ja&rlz=&=&q=中級解説&btnG=Google+検索&aq=f&aqi=&aql=&oq=&gs_rfai=

 見て分かると思いますが、検索した単語である「中級解説」が含まれています。そのため、検索結果画面のリンクをクリックしたとき、検索キーワードである「中級解説」が、リファラーとして送信されます。

 HTTPヘッダーはウェブブラウザーが自ら送信する情報です。サーバーが送信させているのではありませんから、もしユーザーがプライバシーは守りたいと思うのであれば、送信しなければ良いのです。

主要なHTTPヘッダー
Acceptブラウザーが扱うことのできるファイル形式
Referer直前にアクセスしていたページのURL
User-Agent使用しているブラウザー名とバージョン
Accept-Language使用できる言語
Hostアクセス先のウェブサーバー名
web拍手 by FC2
posted by 北条利彦 at 20:59 | Comment(0) | TrackBack(0) | ウェブ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/167505805

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。