BigQueryによるGAトラフィック分析

某旅行会社のeコマース部門にいます。BigQueryを利用してGoogleアナリティクスデータの分析例を紹介します。

2020-01-01から1年間の記事一覧

BigQueryでユーザーの購入日から遡って行動を集計する

Googleアナリティクスデータでも、どんなデータでもそうですがデータを集計する期間を例えば2020年1月1日から1月31日までとすると、当たり前ですがその期間のすべての数値を集計することになります。 BQMLなりAutoMLで購入予測をしたいときに、前述のような…

QwiklabsでGCPトレーニング

いつもは自身のアウトプットの意味も含めてクエリをポストしていますが、今回は番外編ということでQwiklabsを紹介したいと思います。 私自身は、SQLはUdemy にあったwebアナリティクス界の巨人、木田さんのSQL講座で学び、GoogleCloudPlatformについてはQwik…

BigQueryで配列関数を利用して値をだす

BigQueryは配列関数をサポートしており、それを使ってセッション数やPV数を出すこともできます。例えばユーザー単位でvisitidを配列にして、そのを数えると、ユーザーごとのセッション数を出すことができます。ARRAY_LENGHはドキュメントを見ると「配列のサ…

BigQueryでGoogleアナリティクスの集計値を簡単なクエリでだす

BigQueryに送られるGoogleアナリティクスのデータには、関連するフィールドをグループ化してスキーマを広げることができるデータ型があります。そのことを構造体というらしく、概念的には、構造体はメインテーブルに事前に結合された別テーブルのようなもの…

BigQueryでGoogleアナリティクスのトランザクションの間隔をだす

「Googleアナリティクスのセッションの間隔をだす」でセッションの間隔を出したのですが、トランザクションにも応用できるのでポストします。 select round(avg(interval_session),2) as avg_interval_session from (select fullvisitorid, paese_date('%Y%m…

BigQueryでGoogleアナリティクスのセッションの間隔をだす

Googleアナリティクス上ではユーザーあたりのセッション数はでていますが、セッション間の間隔は集計されていませんのでそれを出したいと思います。 select round(avg(interval_session),2) as avg_interval_session from (select fullvisitorid, parse_date…

BigQueryで訪問回数ごとのユーザーCVRをだす

「訪問回数ごとのユーザー分布を集計する」でユーザーの訪問回数ごとの分布をだしました。このエントリーでは、その分布にコンバージョンしたユーザー数を追加して、訪問回数単位のユーザーコンバージョン率を出したいと思います。 手順としてはコンバージョ…

BigQueryによるLTV算出とABC分析

Googleアナリティクスでライフタイムバリューのメニューができて久しいですが、BigQueryで顧客ごとのLifeTimeValueの算出とABC分析を行いたいと思います。 LTVの算出 ユーザー単位での一定期間の売り上げ総額を出すのは比較的簡単です。 select fullvisitori…

BigQueryMLでkmeansモデルを使って予測をする

kmeansによるクラスタリングのエントリーでBigQueryMLを使って、サイト訪問者のクラスタリングを行いました。クエリ自体は凝ったものではなく、サイトに訪問するユーザーのデバイス・ブラウザ・アクセス場所等の情報でクラスタリングしていますので、実務で…

BigQueryで相関係数を出す

BigQueryにはいくつか統計集計関数がサポートされていますが、CORR関数を使って相関係数をだしたいと思います。 「BigQueryでサンプルデータを使う」のエントリーで紹介したGoogleアナリティクスのサンプルデータを使って、CVRと直帰率の相関係数を出してみ…

BigQueryでサンプルデータを使う

BigQueryを自分のパソコンで自習したいときってないでしょうか?アカウントは自身で作成できても、データがありませんよね。会社のデータを使うわけにもいかないでしょうし。。 ですが、ご安心ください。一般に公開されているデータを使うことができるように…

BigQueryMLでkmeansによるクラスタリング

BigQueryMLで機械学習モデルを構築する BigQueryには標準SQLを使って機械学習を利用することができますが、BigQueryAPIが有効なプロジェクトでなければいけません。有効になっていなければこちらの「APIsを有効にする」から設定してください。 リファレンス…

BigQueryでGoogleアナリティクスのセッション開始日・時・分・秒を出す

BigQueryでセッションの開始日・時間・分・秒を出す 「BigQuery Export のスキーマ」には「visitStartTime」がありますので、これを使えばいいのですが、DATETIME型ではなくタイムゾーンもUTCになっています。このままでは、いつの何時何分からセッションが…

BigQueryでGoogleアナリティクスデータを差分更新をする

BigQueryでGoogleアナリティクスデータの差分を更新する クエリのスケジュール化の方法は「クエリの定期的実行を自動化する」で紹介させていただきましたが、Googleアナリティクスデータを日次で差分取り込みしたい場合は、前日分だけ取得するように書く必要…

BigQueryでGoogleアナリティクスデータの期間を指定する

BigQueryでGoogleアナリティクスデータの期間を指定する BigQuery内にあるGoogleアナリティクスデータの期間を指定するには、このように書きます。 select date, count(distinct fullvisitorid) as user, sum(totals.visits) as session, sum(totals.newvisi…

BigQueryのクエリの定期的実行を自動化する

BigQueryのクエリの実行を定期的にスケジュールする BigQueryのSQL実行結果のテーブルをデータポータで可視化してモニタリングしているような場合、数字更新を自動化したいときがあると思います。そんなときはクエリ実行を自動化すると便利です。 まずはAPI…

BigQueryで特集ページのコンバージョン貢献を集計する

特集ページのコンバージョン貢献 特集ページが見られたセッションで予約に至ったかどうかを把握する方法を紹介します。以前のエントリーでも書きましたが、GoogleアナリティクスのUI上でも特集ページごとにセグメントを設定すれば可能ですが、数が多いと面倒…

BigQuery内のGAデータからトランザクション情報を集計する

BigQuery内のGAデータからeコマースタグで送信された値を取得する 機械学習用のテーブルを作成しようと、Googleアナリティクスの拡張eコマースで送られた値を取得しようとしていたのですが、なかなかうまくいかず難儀していました。 BigQuery Export のスキ…

BigQueryでページカテゴリ単位のPV数、セッション数を集計する

BigQueryでGoogleアナリティクスデータのページカテゴリ単位のPV数、セッション数を集計する GoogleアナリティクスのUI上なら、ディレクトリ単位のPV数の把握は容易にできますが、ディレクトリ単位のセッション数となるとセグメントをかける必要があります。…

BigQueryでGoogleアナリティクスの訪問回数ごとのユーザー分布を集計する

ユーザーが一定期間に何回訪問したかを集計し、訪問回数ごとのユーザー数の分布をだしてみた。 Googleアナリティクスでは、ユーザー数や新規ユーザー数はわかりますが、訪問回数ごとのユーザー数を把握するにはやや手間がかかります。 今はユーザーエクスプ…

Bigqueryで集計したGoogleアナリティクスのセッション数とGAのUI上のセッション数が合わない

BigqueryでGoogleアナリティクスのトラフィック分析だ! 自らのスキルアップのためにもSQLを使えるようになってBigqueryで分析するぞ!と思い、オンライン講座でSQLの基本的なことを学びBigqueryを使い始めました。 当然、使う上でいろいろ分からないことが…