<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>エクスポート on Marketechlabo</title><link>https://www.marketechlabo.com/tags/export/</link><description>Recent content in エクスポート on Marketechlabo</description><generator>Hugo -- gohugo.io</generator><language>ja-jp</language><lastBuildDate>Wed, 23 Mar 2022 00:00:00 +0900</lastBuildDate><atom:link href="https://www.marketechlabo.com/tags/export/index.xml" rel="self" type="application/rss+xml"/><item><title>GA4無料版と有料版のBigQueryエクスポートの違い</title><link>https://www.marketechlabo.com/web-analytics/ga4-bigquery-export-differences/</link><pubDate>Wed, 23 Mar 2022 00:00:00 +0900</pubDate><guid>https://www.marketechlabo.com/web-analytics/ga4-bigquery-export-differences/</guid><description>
&lt;h2 id="2種類のbigqueryエクスポート"&gt;2種類のBigQueryエクスポート&lt;/h2&gt;
&lt;p&gt;GA4のBigQueryエクスポートデータには以下の2種類がある。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;イベントデータ&lt;/li&gt;
&lt;li&gt;ユーザーデータ&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;ユーザーデータは1行1人で、&lt;code&gt;user_pseudo_id&lt;/code&gt;単位で集約したデータと、&lt;code&gt;user_id&lt;/code&gt;単位で集約したデータのそれぞれのテーブルが生成される。
所属するオーディエンスの情報やユーザ（&lt;code&gt;user_pseudo_id&lt;/code&gt; / &lt;code&gt;user_id&lt;/code&gt;）単位の通算指標が含まれる。
分析によく使うのがイベントデータで、1行1イベントでイベントパラメータなどがネストされて含まれている。&lt;/p&gt;
&lt;h2 id="エクスポートの頻度"&gt;エクスポートの頻度&lt;/h2&gt;
&lt;p&gt;イベントデータの出力頻度は以下の3種類がある。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ストリーミング＝リアルタイム。重複や使えない列あり（トラフィック関連の列）&lt;/li&gt;
&lt;li&gt;毎日→翌日に、前日分をまとめて、重複除外処理やトラフィック情報のアトリビューション処理済みの形で出力される&lt;/li&gt;
&lt;li&gt;毎日（高頻度）＝「毎日」のデータを当日高頻度で出力する。「ストリーミング」と「毎日」の中間だが、トラフィック関連の列は出力される&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これらは設定画面の「頻度」に対応している。
&lt;figure&gt;
&lt;picture&gt;
&lt;img
loading="lazy"
decoding="async"
alt=""
class="image_figure image_internal image_unprocessed"
src="/images/ga4-bq-export/06-specify-data-stream.jpg"
/&gt;
&lt;/picture&gt;
&lt;/figure&gt;
この中で「毎日（高頻度）」は有料版限定のオプションになる（無料版の管理画面では選択肢が表示されない）。&lt;/p&gt;
&lt;h3 id="ストリーミングデータの問題点"&gt;ストリーミングデータの問題点&lt;/h3&gt;
&lt;p&gt;&lt;strong&gt;ストリーミングデータでは重複や欠損の行が一部含まれる可能性があるのと、流入元アトリビューション処理ができておらず、&lt;code&gt;traffic_source.***&lt;/code&gt;列と&lt;code&gt;session_traffic_source_last_click.***&lt;/code&gt;が欠損して出力される&lt;/strong&gt;。
&lt;a href="https://support.google.com/analytics/answer/9358801"&gt;https://support.google.com/analytics/answer/9358801&lt;/a&gt;&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-txt" data-lang="txt"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;このテーブルには、その日に発生したセッション アクティビティのレコードが保持されます。ストリーミング エクスポートはベスト エフォート型の処理であり、イベントの遅れやアップロードの失敗などにより、データに漏れが生じる場合もあります。データは 1 日を通して継続的にエクスポートされます。セッションが複数のエクスポート周期にまたがっていると、テーブルにはそのセッションのレコードが複数保存されることがあります。
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;BigQuery のストリーミング エクスポートには、新規ユーザーについては次のユーザー アトリビューション データは含まれません。
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;traffic_source.name（レポート ディメンション: ユーザーのキャンペーン）
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;traffic_source.source（レポート ディメンション: ユーザーの参照元）
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;traffic_source.medium（レポート ディメンション: ユーザーのメディア）
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;1日1回の再計算の中ではこれらを処理し、より正確なデータを生成しなおす。より正確なデータや、Googleのアトリビューションと同じロジックの流入元データ&lt;code&gt;traffic_source.***&lt;/code&gt;（「ユーザーの参照元」など）と&lt;code&gt;session_traffic_source_last_click.***&lt;/code&gt;（「セッションの参照元」など）の情報が欲しければ毎日のデータを使う必要がある。&lt;/p&gt;
&lt;h2 id="bigqueryエクスポート設定のパターンと出力されるテーブル"&gt;BigQueryエクスポート設定のパターンと出力されるテーブル&lt;/h2&gt;
&lt;p&gt;BiqQueryエクスポート設定では2個のチェックボックスがあった。2個のいずれかを選択するのではなく、それぞれチェックを入れる形式である。つまり以下の3パターンの出力設定がある。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ニアリアルタイムのデータのみ&lt;/li&gt;
&lt;li&gt;1日1回再計算データのみ&lt;/li&gt;
&lt;li&gt;ニアリアルタイム＋1日1回再計算&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;それぞれについて生成されるテーブル名を見ていく。
まず**データセット名はいずれも&lt;code&gt;analytics_計測ID&lt;/code&gt;**となる&lt;/p&gt;
&lt;h3 id="ニアリアルタイムデータのみ"&gt;ニアリアルタイムデータのみ&lt;/h3&gt;
&lt;p&gt;生成されるテーブル名&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;events_intraday_YYYYMMDD&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;（&lt;code&gt;YYYYMMDD&lt;/code&gt;の部分は毎日の日付が入る）
（例）&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;2022年3月1日の日中は
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;events_intraday_20220301&lt;/code&gt;: 2022年3月1日のリアルタイムデータ&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;2022年3月2日の日中は
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;events_intraday_20220301&lt;/code&gt;: 2022年3月1日の全データ（不完全かも）&lt;/li&gt;
&lt;li&gt;&lt;code&gt;events_intraday_20220302&lt;/code&gt;: 2022年3月2日のリアルタイムデータ&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;2022年3月3日の日中は
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;events_intraday_20220301&lt;/code&gt;: 2022年3月1日の全データ（不完全かも）&lt;/li&gt;
&lt;li&gt;&lt;code&gt;events_intraday_20220302&lt;/code&gt;: 2022年3月2日の全データ（不完全かも）&lt;/li&gt;
&lt;li&gt;&lt;code&gt;events_intraday_20220303&lt;/code&gt;: 2022年3月3日のリアルタイムデータ&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;というテーブルが存在することになる。&lt;/p&gt;</description></item></channel></rss>