Criteoとは

CriteoはCriteoエンジンによる機械学習を活用し、ユーザーがクリックした商品に関連性の高い商品を提示する広告サービスです。Criteoというサービス名はGoogle広告やFacebook広告といったサービスと比べやや知名度が低いかもしれませんが、Criteo広告自体は多くの方が目にしたことがあると思います。

Criteo広告も他の広告サービス同様インプレッション数やクリック数といったデータの分析は非常に重要です。また他の広告サービスのデータとも絡めた横断的なデータ分析も有効です。

いずれの場合も広告データをデータ分析基盤に統合し、データの高速処理に特化したDWH(データウェアハウス)、データの可視化に特化したBIツールを活用していくこととなります。しかしデータの統合はデータエンジニアリングの知識が必要で、データの知見がないマーケティング部門の方にとっては少しハードルが高いです。

概要

そこで今回はデータ分析基盤構築サービスtrocco®を利用し、複雑なコーディング作業なしにCriteoのデータをGoogle BigQueryというDWHへ統合し、Looker Studio(旧:Googleデータポータル)を利用してデータの可視化を行います。

データの転送手段として採用したtrocco®は、Criteo広告以外に、Yahoo!検索広告、Google広告、Twitter広告、LINE広告などにも対応しています。

CriteoのデータをGoogle BigQueryへ転送

ゴール

Criteo広告のデータをこのように可視化します。作成後は自動で最新値に更新することも可能です。

ゴール.PNG

こんな人におすすめ

  • Criteo広告のレポートデータを分析基盤・DWH(データウェアハウス)に取り込みたい
  • 広告レポートをCSVファイルにエクスポートして分析基盤に取り込むのに時間がかかる
  • 広告管理画面からデータ取得を行う作業に疲れている

1. DWHと同期する手段の決定

1-1. DWHの決定

まずはデータを集約する場所である、DWHを決定します。

  • Google BigQuery
  • Amazon Redshift
  • MySQLやPostgreSQL

trocco®はいずれのサービスにも対応していますが、今回はGoogle BigQueryを利用することにします。

1-2. CriteoのレポートデータをGoogle BigQueryに転送する4つの方法

Google BigQueryにデータを集約することが決まったので、続いて転送するための手段を検討します。

  1. レポートデータをCSV形式でエクスポートし、手動でGoogle BigQueryにアップロードする
  2. CriteoとGoogle BigQueryの各APIを利用し、自分でプログラムを書いて連携する
  3. Embulkを利用し、自分で環境の構築を行う
  4. trocco®を利用し、画面上の設定のみで転送する

1 は単発の分析であればともかく、日々更新される広告データを定期的に取り込むとなると毎回同じ作業を行う必要があり、時間と手間がかかります。
2 はAPIについてのキャッチアップ、環境構築とエラー処理といった運用面での手間が発生します。
32 と同じく、Embulkはある程度の専門知識が必要になり、自分で環境構築・運用を行う手間が発生します。加えてエラーの内容が専門的で、その処理は難易度が少し高いです。

そこで今回は自動での更新が可能であり、プログラムを書かずに画面上の設定による簡単な作業で済む、4 のtrocco®を利用します。

2. trocco®でCriteo → Google BigQueryの転送自動化

2-0. 事前準備

データの転送にはtrocco®のアカウント、Google BigQueryとLooker Studioを利用するGoogleアカウントが必要です。

trocco®は無料トライアルを実施しているので、事前に申し込みをしておきましょう。
https://trocco.io/lp/index.html
(申し込みの際に、こちらの記事を見たという旨を記載して頂ければご案内がスムーズに行えます)

2-1. 転送元・転送先を決定

trocco®にアクセスして、ダッシュボードから「転送設定を作成」ボタンを押します。

image.png

転送元に「Criteo」を指定し、転送先に「Google BigQuery」を選択して「この内容で作成」ボタンを押します。

転送設定.png

設定画面になるので、必要な情報を入力していきます。

2-2. Criteoとの連携設定

trocco®には社内のユーザー間でチームを作成し、チームで転送設定を共有するチーム機能があります。チームの他メンバーが見たときに設定の内容がわかるよう転送設定の名前とメモを入力します。

概要.PNG

続いて「転送元の設定」内の「接続情報を追加」ボタンを押します。

転送元.png

別のタブで接続情報の新規作成画面が開きます。
データを取得したいCriteoアカウントの情報を入力し、接続情報を作成します。

接続情報.png

再度転送設定画面に戻り、接続情報の「再読込」ボタンを押すと、先ほど作成した接続情報が選択できるようになります。
これでCriteoとの連携は完了です。

接続情報criteo.png

2-3. Criteoからのデータ抽出設定

どのようなデータを取得するかを設定していきます。
今回は日別のクリック数に関するデータを取得してみます。

転送元Criteo.png

またカスタム変数を利用してデータの取得期間を指定することで、直近一日分のデータを転送するなどの設定が出来ます。

2-4. 転送先Google BigQueryの設定

転送元と同様に設定していきます。Google BigQueryに関してもGoogleアカウントとの連携が可能です。(事前に転送先となるデータセットとテーブルを作成しておいてください。)

転送先.png

転送先とするデータセット名、テーブルを設定します。

転送先.png

これで入力は完了です。「保存して自動データ設定・プレビューへ」をクリックし、確認作業に進みましょう。

2-5. データのプレビュー

Criteo広告からどのようにデータが転送されるかプレビューで確認することが出来ます。取得したいデータが表示されていなければ再度設定画面に戻って設定をやり直します。

プレビュー.PNG

転送したいデータが取れているので、設定を完了します。
転送設定の一覧から作成した設定を選び「スケジュール・通知設定」に進みます。

2-6. スケジュール設定

「スケジュール・トリガー設定」タブを開きます。

トリガー.png

「スケジュールを追加」ボタンを押すと、以下の画像のような入力欄が出てきます。ここで実行スケジュールを設定することで、転送を定期的に実行し自動化することが出来ます。

スケジュール登録.png

2-7. 通知設定

通知タイプ・通知条件・通知先を選択し設定を保存することで、EmailやSlackに通知を行うことも出来ます。

貼り付けた画像_2021_03_24_12_19.png

2-8. データ転送ジョブの実行

設定は以上です。最後に手動で転送ジョブを実行し、Google BigQueryにデータを送ります。
手動で実行する場合はジョブ詳細画面の「実行」ボタンを押します。

実行.png

これで転送は完了です。

3. Google BigQueryの設定

Google BigQuery側での操作は特に必要ありませんが、念の為プレビュー画面を確認するとデータが確かにデータが転送されています。

BQ.png

4. Looker Studio(旧:Googleデータポータル)で可視化

Google BigQueryの画面から、「エクスポート > データポータル」を選択します。

データポータル.png

以下のようなLooker Studioの画面に遷移します。
試しに、クリック数の日次推移を可視化してみましょう。
グラフの概形として時系列グラフを選択し、横軸に日付、縦軸にクリック数を設定します。

レポート.png

以下のようなグラフが出来上がります。

グラフ.png

まとめ

いかがでしたでしょうか。trocco®を利用することでCriteoの管理画面を触ることなく、簡単にCriteo広告のレポートデータを取得し、DWH(今回はGoogle BigQuery)へ統合することが出来ました。
またGoogle BigQuery、Looker Studio(旧:Googleデータポータル)を連携することで簡単にデータの可視化が行えます。

trocco®では、クレジットカード不要のフリープランをご案内しています。ご興味がある方はぜひこの機会に一度お試しください。

hirokazu.kobayashi

慶應義塾大学卒業後、2014年より株式会社リブセンスへ入社。データエンジニアとして同社分析基盤立ち上げをリードする。2017年より現職primeNumberに入社。自社プロダクト「systemN」におけるSpark/Redshift活用等のデータエンジニアリング業務を行うかたわら、データ統合業務における工数削減が課題だと感じ、データ統合を自動化するサービス「trocco®」を立ち上げる。