GA4のレポート用識別子はどれを選ぶのが正解?違いについて解説

Google Analytics

GA4の管理画面から「レポートID」を選択すると、どの基準でユーザーを識別するかの設定ができる。
ユーザーの識別とは、一人のユーザーをGA4の計測上同じユーザーとして扱うことを指し、データを精緻に取得するためには大事な要素となっている。

本記事では、3種類あるユーザー識別スペースの違いと、同じく3種類あるレポート用識別子の違いについて解説し、どれを選ぶのが最適かについても言及する。

3つのユーザー識別スペース

ユーザーを識別するための情報には以下の3つがある。
なお、これらは総称して「ユーザー識別スペース」と呼ばれる。

  • User-ID(ユーザーID)
  • デバイスID(Cookie ID)
  • モデル化データ(モデリング)

User-ID(ユーザーID)

ECサイトや求人サイトのように会員ログイン機能があるサイトでは、ユーザーはIDやパスワードを入力する必要があるが、このユーザーIDが識別子となる。

1人のユーザーにつきユーザーIDは1つなので、デバイスを跨いだアクセスでも同一ユーザーとして識別することができ、ユーザー識別スペースの中で最も精度が高い。

なお、User-IDは自社が自社が保有するIDであるため、取得するには特別な実装が必要になる。
実装方法についてはこちら
[GA4] User-ID で複数のプラットフォームをまたいでアクティビティを測定する

デバイスID(Cookie ID)

Googleが発行するファーストパーティーCookieによる識別子で、UA(ユニバーサルアナリティクス)のときにも基本的にデバイスIDが利用されていた。

Cookieの性質上、同一ユーザーでも、アクセスするデバイスが変わったりブラウザが変わったりすると、別のCookieが付与されて、異なるユーザーとして判定されるため、User-IDほど精度は高くない。

モデル化データ(モデリング)

モデル化データは、厳密にはユーザー識別子ではないが、機械学習モデリングを利用してユーザー数を補完する役割がある。

昨今、サイトに訪れた段階でCookieの利用を許可するかどうかの同意を求められることが多くなってきているが、ユーザーがそれを拒否すると、そのアクセスについては計測できなくなってしまい、実際の数よりも少なくなってしまう。
そのため、Cookieを受け入れているユーザーの行動を機械学習にかけ、その数を調整するのがモデル化データである。

なおモデル化データは、以下のレポートおよび機能においては対応していない。

  • オーディエンス
  • データ探索のユーザー エクスプローラ・コホート・ユーザーのライフタイム
  • シーケンスが定義されたセグメント
  • 維持率レポート
  • 予測指標
  • データのエクスポート(例: BigQuery Export)

3つのレポート用識別子

レポート用識別子には、以下の3つがある。

  • ハイブリッド
  • 計測データ
  • デバイスべース

それぞれが使用できるユーザー識別スペースを表にまとめると以下のようになる。

レポート用識別子User-IDデバイスIDモデル化データ
ハイブリッド
計測データ
デバイスベース

ハイブリッド

3つのユーザー識別スペースの章で解説したすべての識別子が使用され、User-IDが収集されている場合はUser-IDを、User-IDが利用できない場合はデバイスIDが利用される。User-IDもデバイスIDもどちらも利用できない場合はモデリングが利用される。

計測データ

3つのユーザー識別スペースの章で解説した識別子のうち、User-IDとデバイスIDのみが使用され、User-IDが収集されている場合はUser-IDを、User-IDが利用できない場合はデバイスIDが利用される。

先述した、モデル化データが利用できないレポートにおいては、「ハイブリッド」と同じ結果になる。

デバイスベース

3つのユーザー識別スペースの章で解説した識別子のうち、デバイスIDのみが使用される。

Googleシグナルによるユーザー識別はなくなった!?

2024年2月から、それまでユーザー識別スペースの1つとして利用されていた「Googleシグナル」によるユーザー識別が廃止されている。
Googleシグナルとは、ユーザーがログインしているGoogleアカウントをもとに生成されたデータのことで、User-IDの次にユーザーの識別精度が高かったが、今はすでになくなっている。

結局どのレポート用識別子を選べばいいの?

「機械学習によって補完されたデータなんていらない!」といったこだわりなどが特段なければ「ハイブリッド」で問題ない

ハイブリッドはすべてのユーザー識別スペースを兼ね備えており、最も精度の高いものから順に利用される仕組みになっているため、特別な事情がない限りわざわざ「計測データ」や「デバイスベース」を選ぶ必要もないだろう。

Googleシグナルが識別子として利用されていた頃は、ユーザーのプライバシー保護のためにレポートにしきい値がかかることが多かったが、それが廃止されて以降、そのようなリスクもあまり心配にならなくなったため、「ハイブリッド」を選択しておくのが最も無難といえる。

おわりに

今回は、ユーザー識別スペースの違いやレポート用識別子の違い、最適なレポート用識別子について解説した。

GA4の「レポートID」設定画面は頻繁に変更するものではないため、普段はあまり気にする必要はないかもしれないが、一度は必ず確認しておくべき重要な部分でもある。

それぞれの違いをきちんと押さえ、よく理解しておくようにしよう。