概要

Google Spreadsheets(スプレッドシート)はGoogleアカウントさえあれば誰でも無料で利用でき、複数人で共有しながらデータを管理できるツールです。また同じくGoogleアカウントさえあれば無料で利用できるGoogle フォームで作成したアンケートの結果もスプレッドシートと連携、出力することで容易に集計することが可能です。
アンケートの結果だけでなく、セールスやマーケティングのデータベースとしてもしばしば利用されるスプレッドシートですが、ここに集められた大量のデータを他のDWH(データウェアハウス)に統合し、BIツールで可視化、戦略的な分析を行うというデータ分析基盤の構築にはある程度専門的なプログラミングの知識が必要になってきます。また常に新しいデータが集まる中、分析を最新の状態に保つのはコストがかかることです。

そこで今回は、trocco®(トロッコ)という分析基盤向けデータ統合サービスを使い、Google Spreadsheetsのデータ抽出、DWH(今回はGoogle BigQueryを使用)へのデータ統合、Tableauを用いた可視化+これらの自動化までをノンプログラミングでやってみます。
なお今回データの転送手段として使用するtrocco®は、スプレッドシートの他にも、様々な広告・CRM・DBなどのデータソースに対応しています。

スプレッドシートのデータをGoogle BigQueryへ転送

ゴール

今回はGoogleフォームを利用してアンケートを作成し、その結果をスプレッドシートへ出力、そのシートをデータ元としてデータ分析を行うというケースを想定し、このようなアンケートから、

スクリーンショット 2022-03-02 15.19.53.png

下のように出力されたアンケート結果を、

スクリーンショット 2022-03-02 11.56.png

このように可視化することを目標にします。

スクリーンショット 2022-03-02 14.11.02.png

※なお上記のデータは本記事作成のために用意したサンプルのデータです。

こんな人におすすめ

  • スプレッドシートに集まるデータを定期的に転送するのは面倒だ
  • Googleフォームを利用したアンケートの結果などデータを自動的に分析できるようにしたい
  • スプレッドシートをデータ元として利用し、戦略的な分析を行いたい
  • プログラミングはよくわからないがデータ分析をやってみたい

1. trocco®での設定

1-0. 事前準備

データの転送にはtrocco®のアカウントが必要です。
trocco®は現在無料トライアルを実施しています。事前に申し込みをしておきましょう。
https://trocco.io/lp/index.html
(トライアル申し込みの際にこちらの記事を見たという旨を記載して頂ければご案内がスムーズに行えます)
またデータ元となるスプレッドシートを編集し、Google BigQueryを操作できるGoogleアカウントも必要です。2つのアカウントが異なっていても問題ありません。

1-1. 転送元・転送先の決定

trocco®にアクセスして、ダッシュボードから「転送設定を作成」ボタンを押します。

スクリーンショット 2022-03-02 13.25.04.png

転送元と転送先となるツールを選択する画面になります。

スクリーンショット 2022-03-02 13.29.39.png

trocco®は多くのサービスをサポートしています。今回は転送元に「Google Spreadsheets」を選択し、転送先には「Google BigQuery」を選択します。

スクリーンショット 2022-03-02 13.31.13.png
スクリーンショット 2022-03-02 13.32.12.png

できたら「この内容で作成」ボタンを押します。

スクリーンショット 2022-03-02 13.32.53.png

2-1. Google Spreadsheetsからの転送設定

まずは右上の「接続情報を追加」ボタンを押します。

スクリーンショット 2022-03-02 13.34.27.png

別のタブでGoogleアカウントとの連携設定画面が開きます。データ元になるスプレッドシートを編集できる(データを読み込むことができる)アカウントを選択し、連携を行います。
転送設定画面に戻り、「接続情報を読み込む」ボタンを押すと右の▽マークから接続情報を読み込めます。

スクリーンショット 2022-03-02 13.38.10.png

接続情報が設定できたら転送に必要な情報を入力していきます。

スクリーンショット 2022-03-02 13.38.44.png

2-2. Google BigQueryへの転送設定

転送元のスプレッドシートと同様に設定をしていきます。Google BigQueryに関しても「接続情報を追加」ボタンから別のタブでGoogleアカウントとの連携を行います。

(事前に転送先となるデータセットとテーブルを作成しておいてください。)

スクリーンショット 2022-03-02 13.39.06.png

転送先とするデータセット名、テーブルなど必要な情報を入力します。入力が済んだらページ最後の「次のSTEPへ」ボタンを押します。

スクリーンショット 2022-03-02 13.39.38.png

2-3. データのプレビュー・詳細設定

設定にしたがって転送のレビューが作成されます。

スクリーンショット 2022-03-02 13.41.48.png

転送元からどのようにデータが取得されるのか確認できます。特に問題なく取得できていそうなのでプレビュー画面下部の「確認画面へ」ボタンを押します。

スクリーンショット 2022-03-02 13.47.33.png

なおプレビュー画面下部の詳細設定ではデータのマスキング処理や転送するカラムの選択などデータの加工設定ができます。

スクリーンショット 2022-03-02 13.48.11.png

2-4. 確認・適用

転送設定の内容が確認できます。既存の転送設定を編集した際にはこの画面でその差分がハイライト表示され、確認することが可能です。
今回は設定の初版なので特に確認することはありません。右下の「保存して適用」ボタンを押します。

スクリーンショット 2022-03-02 13.48.51.png

trocco®には転送設定の変更後も過去の設定履歴を保存し、変更によって転送が失敗するようになった際など必要に応じて過去の設定を復元する機能があります。
チームでtrocco®を共有して使用する場合などは転送設定の変更についてこの画面で簡単なメモを残しておきましょう。

スクリーンショット 2022-03-02 13.49.29.png

2-5. スケジュール・通知設定

転送設定の詳細設定画面に遷移します。まず「転送設定概要」タブでは設定の内容を大まかに確認できます。

スクリーンショット 2022-03-02 13.50.22.png

今回は転送の自動化がゴール一つです。「スケジュール・トリガー設定」タブを開いて定期的な転送スケジュールの設定を行います。「スケジュールを追加」ボタンを押すと、以下のモーダルが出てきます。ここで実行スケジュールを設定することで、転送を定期的に実行し自動化することが出来ます。(今回は毎日0時に転送を行うよう設定します。)

スクリーンショット 2022-03-02 13.51.01.png
スクリーンショット 2022-03-02 13.51.56.png

2-7. データ転送ジョブの実行

設定は以上です。転送は以後自動的に行われますが、右上の「実行」ボタンから手動で転送を実行します。

スクリーンショット 2022-03-02 13.53.18.png

転送の実行に際しその目的などをメモとして残しておくことができます。再び「実行」ボタンを押します。

スクリーンショット 2022-03-02 13.55.23.png

ジョブが実行されます。

スクリーンショット 2022-03-02 13.56.14.png

ジョブが成功しました。

スクリーンショット 2022-03-02 13.57.00.png

3. Google BigQueryの設定

こちらで設定することは特にありませんが、プレビュー画面からはtrocco®の転送設定で選択したテーブルにはデータがきちんと転送されていることが確認できます。

スクリーンショット 2022-03-02 13.58.25.png

4. Tableauでの可視化

最後にTableuを利用して可視化を行います。まずはトップ画面右上の「新規」
から新しいワークブックを作成します。

スクリーンショット 2022-03-02 14.01.12.png

自動的にデータの接続先を選ぶ画面になるので、コネクタからGoogle BigQueryを選択します。(ここでGoogleアカウントとの連携設定を行います。)

スクリーンショット 2022-03-02 14.01.47.png

画面左側でデータを転送したプロジェクト、データセットを選び、読み込まれたテーブルをワークブックに追加します。

スクリーンショット 2022-03-02 14.03.20.png

新しいシートの左側にはGoogle BigQueryから読み込まれたカラムの名前がフィールドとして表示されています。これらを行と列に配置し、右上の表示設定から任意のグラフを選択することで簡単にグラフを作成することが可能です。

スクリーンショット 2022-03-02 14.11.58.png

同じようにいくつかグラフを作成し、ダッシュボードに配置して完成です。

スクリーンショット 2022-03-02 14.11.02.png

まとめ

いかがでしたでしょうか。今回はスプレッドシートのデータをGoogle BigQueryへ自動的に統合、Tableauで可視化という流れをノーコーディングで作ってみました。このようにtrocco®を使うことで、複数人で編集したり絶えず更新されるスプレッドシートのデータでも自動でGoogle BigQueryにまとめていくことができるほか、100万規模の大きなデータからごく小さなデータまで複雑なコーディングをせずtrocco®の画面上の設定のみでデータの転送が可能です。


trocco®では、クレジットカード不要のフリープランをご案内しています。データ統合にご興味がある方はぜひこの機会に一度お試しください。

hirokazu.kobayashi

慶應義塾大学卒業後、2014年より株式会社リブセンスへ入社。データエンジニアとして同社分析基盤立ち上げをリードする。2017年より現職primeNumberに入社。自社プロダクト「systemN」におけるSpark/Redshift活用等のデータエンジニアリング業務を行うかたわら、データ統合業務における工数削減が課題だと感じ、データ統合を自動化するサービス「trocco®」を立ち上げる。