ポストサードパーティcookie時代のトラッキング技術とプライバシー

2021年になり、Googleがサードパーティcookieを廃止する期限が近づいている。サードパーティcookieを使えなくするだけでは単に不便になるだけ、特に広告配信などが立ちいかなくなることから、Googleはプライバシーを考慮したうえでこれまでと同様のことを実現するさまざまな技術をChromeに搭載しようとしている。

この取り組みを総称してPrivacy Sandboxという。Privacy Sandboxを構成する各技術要素へのリンクは以下のページにある。

https://www.chromium.org/Home/chromium-privacy/privacy-sandbox

Privacy Sandboxで何ができるの?

これまでサードパーティcookieが担ってきた役割には主に以下のものがある。

  • アドフラウド検知
  • インタレストに基づいた広告
  • オーディエンスリスト、リマーケティングリストを作る
  • コンバージョン計測

これをそれぞれ置き換える技術を紹介する。

アドフラウド検知:Trust Token API

サイトをまたいだcookieは訪問者の追跡だけでなく、複数のサイトでこの訪問者は信用できる(フラウドではない)という情報を共有されるためにも使われる。サードパーティcookieをブロックするとその機能も使えなくなるわけだが、この部分を個人は特定できない形に制限された状態で、サイトをまたいで認証情報を格納できるようにする。この機能がTrust Tokenである。

2021年3月リリースのChrome89において、origin trialsで公開テストできるようになる予定。

インタレストに基づいた広告:FLoC

従来インタレストベースの広告では複数のサイトの閲覧履歴から訪問者の興味を推定していた。そこではサードパーティcookieをキーにサーバにウェブ閲覧履歴を送り、そのデータに基づいて類似の興味を持つ人たちをクラスタリングしていたわけである。

FLoCでは個人のウェブ閲覧履歴をサーバに送るのではなく、デバイス上(ブラウザ内)でウェブ閲覧履歴からその人の行動パターングループ(コホート)を分類し、その分類結果をサーバに送る。つまりChrome上でJavaScriptを使えばこの分類(コホート)を取得できる。技術的に正確で具体的な説明はこのページで平易になされているので一読をお勧めする。

https://github.com/WICG/floc

なおアルゴリズムのアイデアはこちらのペーパーで紹介されており、こちらは高度。

https://github.com/google/ads-privacy/blob/master/proposals/FLoC/FLOC-Whitepaper-Google.pdf

2021年3月リリースのChrome89において、origin trialsで公開テストできるようにする予定。

オーディエンスリストを作る:FLEDGE

従来はブラウザからIDと行動履歴をサーバに送り、サーバで行動履歴からIDのリストを作っていた。このIDの同一性を保つのにcookieが使われていたわけである。

FLEDGEではIDと履歴をやり取りするのを廃止し、インタレストグループという単位でやり取りすることになる。ブラウザ内で、各ユーザを、個人を特定できないある程度の人数をもつインタレストグループに分類する。このインタレストグループが従来のオーディエンスリストと同じ役割を果たすのだが、リストの生成がサーバでなくブラウザで行われるところに特徴がある。そしてそのグループ単位で広告の入札が行われるのだが、この入札もブラウザ内で行われる

以下のページに広告配信の仕組みの詳細が説明されている(高度なアドテクの話になるが)

https://github.com/WICG/turtledove/blob/master/FLEDGE.md

2021年後半にorigin trialsで公開テストできるようにするということで、他のAPIに比べると遅めの対応になっている。

コンバージョン計測

  • Event Conversion Measurement API

広告のリンクに、コンバージョンをカウントする対象サイトやカウントする期限などの情報を付加する。そしてコンバージョン発生時にコンバージョンピクセルを呼び出すと、広告リンククリック時の情報と結合されて計測サーバに送られる仕組み。

詳細は以下のページで説明されている。

https://web.dev/conversion-measurement/>
<
この機能は現時点のChromeですでに公開テスト中。

  • Aggregated Reporting API

Event Conversion Measurement APIだとラストタッチのクリックスルーコンバージョンしか対応しないのだが、これをビュースルーコンバージョンやアトリビューションに拡張させるために匿名性を持たせつつ計測サーバに送るデータ量を増やすのがAggregated Reporting APIになる。

詳細は以下のページで説明されている。

https://github.com/WICG/conversion-measurement-api/blob/master/AGGREGATE.md

重要なのはPrivacy Sandboxの試みというのはcookieにIDを記録して利用するという個人を特定する機能は排除したうえで、それぞれのイシューを解決しようとしていることである。FLoCもFLEDGEもこれまでサーバにIDを集め、サーバ内処理で表示させる広告を決めていたのを、一部デバイス内処理にすることでサーバにIDを送らないようにする仕組みになる。

2021年3月にリリースされるChromeのバージョン89でテスト用(特定の環境でのみ有効になる)にいくつかの機能が搭載される。このスケジュールを見ると、もしChromeがすべての代替技術をリリースしてからサードパーティcookieをブロックするつもりなのであれば、実際に使えなくなるのは2021年後半以降になると考えられる。

Privacy Sandboxはサードパーティcookie対策としては完璧なの?

ブラウザにはChromeとWebKitがある。より正確に言えばブラウザにはChromium(Blinkレンダリングエンジン)とWebKitがあり、ChromiumはGoogle ChromeやEdgeで、WebKitはiOS内のすべてのブラウザとMacのSafariで使われる。さらにはFirefoxなどもあるが、ややこしいのでシェアの大半を占めるChrome(ただしiOS以外)とWebKitと認識しておけばいい。WebKitはSafariだけでなくiOS内のすべてのブラウザ(Chromeを含む)が対象である。

Privacy SandboxはあくまでGoogleが新しいガイドラインとして提案してChromiumに搭載しようとしているだけで、WebKitで採用されるとは限らないし、AppleとGoogleの関係からWebKitがPrivacy Sandboxを採用する可能性は低い。つまり実質Chromeのシェア(日本では半分程度?)に依存するので、完全とは言えない。

また、すでにWebKit、つまりMacのSafariとiOSのすべてのブラウザではデフォルトでサードパーティcookieがブロックされている点も忘れてはならない。つまりiOSでは現在広告の表示と成果計測が不完全なデータになっており、今後もそれが続く可能性が高いのである。

サードパーティcookie以外のトラッキングに関する問題

サードパーティcookieはトラッキングに関する技術の一部に過ぎない。ブラウザのトラッキングに使われる技術は主に以下のものがある。

  • ファーストパーティcookie(FPC)に関するもの
    • クリックスルーコンバージョン計測
    • Googleアナリティクスなどの自社ウェブ解析
  • サードパーティcookie(TPC)に関するもの
    • オーディエンスターゲティング
    • リマーケティング
    • ビュースルーコンバージョン計測
  • リファラ

それぞれについてプライバシー保護の観点からChromeとWebKitで対策をしている。

Chromeではファーストパーティcookieの挙動は制限していないが、WebKitでは一部のファーストパーティcookieの挙動を制限する。

JavaScriptで生成されたファーストパーティcookieの有効期限が7日間になる。またトラッカー認定されたドメインからクリックIDがついたリンク経由で流入した場合、そのページでJavaScriptが生成したファーストパーティcookieの有効期限が1日になる

JavaScriptで生成された、つまりクライアントサイドで生成されたcookieではダメということで、これらを回避するためにWebサーバ側からcookieを生成する対策方法を考える。しかしそのサーバのドメインがCNAMEレコードで割り当てられたもので、そのサイトとは別の親ドメインのものである場合(CNAMEクローキング)にはファーストパーティcookieの有効期限が7日になる。localStorageなど他のストレージの有効期限も同様に7日間になる。

詳細はITPのページを参照

リファラ(参照元)はChromeではすでに別ドメインからの流入のリファラはドメイン単位までになっている。Safariでも同様だが、さらにドメインがトラッカー認定されている場合は親ドメイン単位までになる。つまりサイト外からの流入についてはどのページから来たかはわからず、ドメイン単位までしか知ることができない

ChromeとSafariのプライバシー/トラッキング対策まとめ

大きく2種類のブラウザがあり、3種類のトラッキング技術がある。これらをまとめると以下の図になる。

FPC=ファーストパーティcookie/TPC=サードパーティcookie

ITP、Privacy Sandboxというキーワードの位置づけはここになる。これを並べ替えてトラッキング技術ごとにまとめたのがこちら。サードパーティcookieが軒並み×になっているのがわかるだろう。

対策はそれぞれについて考える必要がある。

[公開日:2021年3月1日]

計測実装 の記事一覧