なぜGA4の合計と手計算がズレるのか
GA4のレポートを見ていて、行ごとの数値を足した合計と、表の合計行の数値が一致しないことがあります。
これ、計測ミスに見えますが、実はGA4の集計仕様で起きるパターンが多いです。
まずは原因を大きく3つに分けて整理します。
1) ユーザーなどの指標は足し算できない
一番多いのはこれです。
ユーザーは、行ごとに数えているように見えても、合計では重複を除外した数になります。
そのため、行の合計を足すと必ず大きくなり、合計行とは一致しません。
(例)チャネル別にユーザーを並べた場合
・自然検索:80人
・直接流入:60人
手計算:140人
しかし同じ人が自然検索と直接流入の両方で来ていたら、合計行は140人より小さくなります
2) 指標のスコープとディメンションが噛み合っていない
GA4には、ユーザースコープ、セッションスコープ、イベントスコープなど指標ごとの粒度があります。
ここがズレた組み合わせだと、表は出せても合計ロジックが直感とズレます。
たとえば、ユーザーに近い指標をセッション系ディメンションで割ると、行の合計が合計行と一致しないことが起きます。
3) プライバシー保護の処理で一部が抑制される
GA4はプライバシー保護のため、条件によって一部のデータが抑制されることがあります。
このとき、明細の一部が丸められたり、欠落したりして、合計がピタッと合わない原因になります。
直近のデータほど処理が追いついていない場合もあるので、集計日当日の比較は特にズレやすいです。
ズレやすい指標とズレにくい指標
合計が合わないときは、まずその指標が足し算できる性質かを確認するのが近道です。
よく使う指標を、ざっくり分類します。
1) ズレやすい指標
- ● ユーザー(総ユーザー、アクティブユーザーなど)
- ● 新規ユーザー
- ● セッション(ディメンションの切り方によっては非加算になることがある)
- ● エンゲージメント率、直帰率相当の割合指標
- ● 1ユーザーあたり系、1セッションあたり系の平均指標
(例)平均ENG時間が合わない理由
平均系は、行ごとに平均を出しているので、行の平均を足しても合計の平均にはなりません。
合計の平均は、全体の滞在時間 ÷ 全体の対象数で再計算されます
2) ズレにくい指標
- ● 表示回数、イベント数のような回数系
- ● キーイベント数(設定したイベントの発生回数)
- ● 費用や売上などの合計金額系
ただし、回数系でもディメンションの取り方によっては二重計上に見える場合があります。
そのときは次の章のチェック手順で切り分けるのが安全です。
合計が合わないときのチェック手順
合計がズレたときに闇雲に疑うと時間が溶けます。
ここでは実務で使える順番で、確認ポイントをまとめます。
手順1:まず指標が足し算可能かを確認する
最初に、対象指標がユーザー系なのか、回数系なのかを切り分けます。
ユーザー系であれば、合計が合わないのはほぼ仕様です。
まずは合計行を正として扱い、行合計は参考値として見ます。
手順2:ディメンションを1つだけにして再確認する
ディメンションを複数入れると、集計の粒度が複雑になります。
まずはディメンションを1つに絞って、合計がどう変わるかを見ます。
これで原因がスコープの噛み合わせか、別要因かが見えやすくなります。
(例)いきなり複合で見ない
・参照元 / メディア + ランディングページ のように複合にするとズレの要因が増えます。
まずは参照元 / メディアだけで合計の挙動を確認します
手順3:割合指標は合計行の定義で再計算する
CVRなどの割合は、行のCVRを足したり平均したりしても合いません。
合計行は合計行の分子と分母で再計算されるためです。
もしレポート側でCVRを出しているなら、その計算式も合わせて明記しておくと揉めません。
CVRのような派生指標は分母分子の定義がズレやすいので、先に揃えるのがおすすめです。
(例)CVRを合計行の定義で合わせる
・CVR = コンバージョン数 ÷ セッション数 × 100
合計CVRは、合計コンバージョン ÷ 合計セッションで再計算する
手順4:しきい値や欠測の可能性を疑う
明細の一部が抑制されていると、行合計と合計行の差が不自然に見えます。
その場合は次を確認します。
- ● ユーザー属性などを含めていないか
- ● 期間が短すぎないか(1日など)
- ● 直近すぎないか(当日や前日)
手順5:最終的に厳密に合わせたいならローデータで集計する
どうしても合計を厳密に合わせたい場合は、GA4のローデータを元に集計するのが確実です。
GA4はイベントベースのため、レポート画面上の見え方とローデータ集計では発想が変わります。
まとめ:合計は間違いではなく仕様のことが多い
GA4で合計と手計算が一致しないとき、まず疑うべきは計測ミスではなく指標の性質です。
特にユーザー系、平均系、割合系は足し算で合いません。
合わないときは、指標が足し算できるかを切り分け、ディメンションを単純化し、必要なら合計行の定義で再計算します。
それでも厳密さが必要な場面では、ローデータ集計に切り替えるのが近道です。
こうした前提をレポート側で先に説明しておくと、数字の確認作業が減り、改善の話に時間を使えるようになります。