ビジネスのDX化・データの活用の進展により、従来は取得できなかったビッグデータや、顔認証に使用する人の3Dデータなど、量・質ともに取り扱うデータが変化しました。

多様なデータをビジネスに活用していくには、データをうまく活用できるよう土台を固めなければいけません。

売上データの分析は、顧客データ整備なしに実施できず、システムのエラーを即座に検知するには、そのシステムのログデータが淀みなく取得できる必要があります。

データの活用にはその土台作りが欠かせません。

このデータ活用の土台作りが本記事でテーマである「データマネジメント」です。

データマネジメントは広い概念で、取り組み方もさまざまです。基本的な概念を押さえて、自社にあったデータマネジメントを取り入れていきましょう。

データマネジメントとは

データマネジメントとは、社内データの管理運用のための取り組みです。

具体的には、データを誰でも円滑に活用できる環境を管理・維持することを指します。

現在のビジネスはあらゆるデータが価値の源泉となります。Excelで処理する表形式のデータにくわえて、ログデータや動画・音声データにもマネジメントが求められています。

近年はデータについてのデータとも呼ばれるメタデータ、デジタル化されていないアナログな紙の文書など管理すべきデータは多岐にわたります。

データマネジメントの取り組みは、具体的な内容が決められているわけではありません。広く取り入れられている事例だと、「社内のデータ量が増加してきたので、データの高速処理に長けたデータウェアハウス(DWH)を導入して一元管理する」ケースがあります。

また最近はメタデータを活用したデータマネジメントも注目されています。たとえば「データの流れを可視化して管理するデータリネージ」や、「データの検索性を向上させる”データカタログ”」などの取り組みがあります。

データマネジメントはなぜ必要とされているの?

データは収集しただけではフル活用できません。
現場レベルでの業務処理ではデータの整備が課題になっていなくとも、

  • データが散逸していてどのデータがどこにあるかわからない
  • 部署ごとの独自ルールのせいでデータの整合がとれない
  • Excelでのデータ分析では手が追いつかない

など、各部署・部門のデータを統合して利用するには社内データの全社的なケアが必要です。

現場で集めたデータを現場での利用で終わらせず、トップレベルの経営判断や横断的なデータ分析へ活用するにはハード・ソフトを問わずデータのマネジメントが求められています。

データマネジメントを構成する11要素の一覧表

DMBOKはデータの専門家によってまとめられた書籍で、データマネジメントの構成要素は11の領域に分けて整理されています。

日本語版も出版されているため、気になる人はぜひ読んでみてください。本章ではデータマネジメントの構成要素を表でわかりやすくまとめました。

名称概要
データモデリングとデザインデータベースの関係性をモデル化して整理
データセキュリティデータを保護
データ統合と相互運用性データを収集し、各ツールで連携
ドキュメントとコンテンツ管理文書・画像データなど非構造データの管理
参照データとマスターデータデータの一意性を高める取り組み
ストレージとオペレーションデータを保管するツールの設計・運用
データアーキテクチャデータの活用モデルを設計
データガバナンスデータマネジメント全体の統制
データウェアハウジングとビジネスインテリジェンスDWH・BIツールを利用したデータ収集と分析の自動化
メタデータメタデータの収集・活用
データ品質目的に応じたデータの最適化

どのようにデータマネジメントを進めればよいか迷った際には、自社が抱える課題を上記の領域ごとにわけて取り組みを検討するのが有効です。

データの活用基盤はあるものの、データが欠損していたり、形式がバラバラなのが課題であったり、「データ品質」を向上させる取り組みを検討しましょう。

Excelを利用した人の手での分析オペレーションで、その手間を課題に感じていれば、「データウェアハウジングとビジネスインテリジェンス」「データ統合と相互運用性」が関連する領域になります。

データマネジメントのメリット3選

データマネジメントは、データ活用の土台として縁の下の力持ちのような取り組みになります。

ユーザーが実感しにくいメリットもありますが、とくに以下の4つのメリットが得られます。

  • 業務を効率化しほかの分析業務に専念できる
  • データに基づいた新しいマーケティング戦略を立案できる
  • 保護対象データの定食やデータ流出などのリスクを減らせる

業務を効率化しほかの分析業務に専念できる

データマネジメントは、「欲しいデータがどこにあるかわからないない」というケースでよく求められます。

データの分析に先立ち、社内のデータエンジニアチームに欲しい情報を伝え、データが集まったら分析可能な状態に加工し、ユーザーに渡すのは非効率です。

データマネジメントによってデータの検索性を高め、ユーザーが欲しいデータに即座にアクセスできる環境を整えれば分析業務の効率化が期待できます。

データのユーザーは、分析結果の解釈など真にビジネス価値を生む業務に集中できるようになります。

データに基づいた新しいマーケティング戦略の立案ができる

データマネジメントが適切に行き届いていれば、ユーザーの仮説検証も楽になります。

マーケティングであれば、従来の直感に基づいた施策ではなく、データの分析結果に基づいた効果の高い施策が打てるようになります。

データ分析の過程で、分析前は予想もしてなかったようなネガティブなポイントや、商談につながりやすい顧客の属性が明らかになるかもしれません。

データ分析が効率よくできる環境を整えることで、従来の分析が効率化するだけでなくこのような新しいインサイトが得られる機会を増やせます。

保護対象データの抵触やデータ流出などのリスクを減らせる

会社の情報資産の流出は、経営上の大きなリスクです。外部からの攻撃による流出はもちろん、社内からのデータの情報が漏れるケースも想定して対策が必要になります。

データマネジメントの「データセキュリティ」は、ユーザーのアクセス権の管理や、いま誰がどのようなデータに触れているかを管理し、情報流出を未然に防ぎます。

「データベースへのアクセスログをとる」「データの管理責任を明確に定めておく」などの社内での制度的な取り組みにくわえ、セキュリティ面で信頼度が高いサービスへデータを移行することで、セキュリティ負担をベンダーに担ってもらえます。

データマネジメントの成功に欠かせない前提条件

データマネジメントを成功させるには、導入に先立って確認しておきたい点が3つあります。

  • データマネジメントを実施する目的の明確化
  • データの全体像の把握と組織の体制づくり
  • スモールスタート

いずれもデータマネジメントの成功には欠かせない前提条件です。前提条件を押さえてデータマネジメントを導入すれば、データエンジニアの負担軽減や非エンジニア人材によりデータ活用など成功の可能性を高められます。

データマネジメントを実施する目的の明確化

データマネジメントの導入は、データエンジニアチームだけでなく、全社的な取り組みをしなければいけません。

「なぜコストをかけてデータマネジメントを導入するのか」、「データマネジメントを実施してどのような課題を解決したいのか」など、目的意識を明確にしておくことが必要です。

ゴールを設定しないままデータマネジメントを導入しても漠然とした成果しか得られず、コストに対する納得感が得られません。

導入前に決めた目的を明確にして、データマネジメントの導入の先にあるゴールを作りましょう。

データの全体像の把握と組織の体制づくり

データマネジメントの導入に先立って、自社が保有するデータの全体像を明らかにしておく必要があります。

「どのようなサービスがデータベースに接続しているのか」「データベース内のデータの流れはどうなっているのか」など、データの全体像を明らかにしてください。データマネジメントで、何をどこまでカバーすればよいかを決められます。

またデータエンジニアチーム以外の組織の体制も整えなければいけません。

  • 知識がないユーザーがデータを活用するには組織体制を変えるべきか
  • データセキュリティ上の責任者は誰か


など、管理レベルでの検討も必要です。

データマネジメントは人の手でのフルメンテナンスは困難なため、体制面での検討にくわえてデータマネジメントを助けるツールも検討しておくとよいでしょう。

スモールスタート

すべての領域でデータマネジメントを同時並行で進めるのは、社内の混乱を招くだけであまり有効ではありません。

各領域のうち、自社が抱えている課題にもっとも関連した領域から、スモールスタートで進めていくのが成功のコツです。

とくにデータマネジメントの取り組みを進めた後に課題になるのが、非データエンジニアに対する教育や周知などのアフターフォローです。

スモールスタートでデータマネジメントを進めることで、無理なくデータマネジメントの理解を全体に行き渡らせられるようになります。

データマネジメントのやり方

データマネジメントの各領域はデータパイプライン(自社のデータが収集・加工され、分析など活用されるまで)の流れと密接に関係しています。

データマネジメントの導入は、データパイプラインの導入とも呼びます。基本的には自社の課題に合わせて、データパイプラインのうち必要な部分から取り組んで問題ありません。

データパイプラインが整備されていない場合は、以下のようなステップでデータマネジメントを進めていくと良いでしょう。

  1. データガバナンス・データアーキテクチャ
    • データを利用してどのような活用を行うかを設計し、使用するツールを策定する。
  2. データモデリングとデザイン・データ統合と相互運用性・ストレージとオペレーション
    • データパイプライン、データベースの配置を設計する
  3. データウェアハウジングとビジネスインテリジェンス
    • 設計に従ってDWHやBIツールを導入して配置していく
  4. メタデータ・データ品質・データセキュリティ
    • データを管理するための仕組みを導入する

データパイプラインの流れを自動化するETLツールや、データの高速処理やセキュリティに長けたDWHなど、各領域のデータマネジメントは適宜ツールで補えます。

データマネジメントの成功事例

データマネジメントによって成功した事例を2つ紹介します。

いずれの事例も社内にデータエンジニアがいたものの、データ活用に課題を抱えていました。

データマネジメントを進めることで課題を解決し、ビジネスを成長させています。データマネジメントを活用する具体的なイメージを掴んで、自社に取り入れたい担当者の方はぜひ参考にしてください。

株式会社ギフティ様|データ出力の手間と時間が1/5まで削減!

株式会社ギフティ様は、『eギフトを軸として、人、企業、街の間に、さまざまな縁を育むサービスを提供する』というコーポレート・ビジョンのもと、個人向けのカジュアルギフトサービス「giftee」を展開しています。

データマネジメントを導入する以前は、サービスのリニューアルに伴ってデータベースが2つになり、新旧それぞれのデータベースを手作業で統合、分析していたため、大きな時間的なコストが発生する課題を抱えていました。

そこで2つのデータベースを統合するために、ETLツールのtrocco®を導入しDWHのGoogle BigQueryと、BIツールのLooker Studioをベースにしたデータ分析の基盤システムを構築。

データの統合を自動で行うETLツールの導入により、データ分析にかかっていた時間を従来の1/5まで削減し、データエンジニアに依存しないデータ活用の実現に成功しました。

株式会社ホワイトプラス様|LTVの最大化を実現

株式会社ホワイトプラス様は、自宅にいたままクリーニングに出せるネット宅配クリーニング「Lenet(リネット)」を運営しています。

データを管理できるようになるまで、部署ごとにデータのサイロ化(他部署とのデータ連携が取れていない状態)が進展し、部署間での横のデータ連携が取れていない課題を抱えていました。

ETLツールのtrocco®を導入し、各部署が保有するデータをDWHのGoogle BigQueryへ統合、集中管理することで、どの部署も共通のデータベースにアクセスできる体制を構築。

従来は1時間以上、場合によっては半日もの時間がかかっていた約10年分のデータ集計作業を3分以内に短縮させ、データの仮説検証が円滑に回せるようになったのです。

その結果、LTV(ユーザーから全ての取引を通じて得られた利益)の最大化の鍵となる要素を特定し、利用回数の改善に成功しました。

まとめ

本記事では、データマネジメントの概要や必要性、活用事例を解説しました。

データマネジメントの導入は楽なものではありません。しかし各ステップごとに順を追って導入を進めれば、長期的には大きなメリットが得られます。

データ量が増えつづけても容易に対応できる高いスケーラビリティや、新規サービスと既存の体制とのスムーズな連携、これらはデータマネジメントの視点を欠いた場当たり的な改修の繰り返しでは困難です。

これからの時代、いかにデータを管理・活用できるかによって、事業を成長させられるかが変わってきます。データマネジメントを活用して、次のステージに進みたい担当者の方はぜひ導入を検討してみてはいかがでしょうか。

また2つの事例でも取り入れていた弊社のtrocco®は、データ統合をサポートするETLツールです。「データリネージ機能」や「データカタログ機能」など、近年注目されているメタデータを活用したデータマネジメント機能への対応に強みがあります。

データパイプラインの運用・管理をトータルにサポートし、データマネジメントの向上にも効果を発揮します。

trocco®では、クレジットカード不要のフリープランをご案内しています。ご興味がある方はぜひこの機会に一度お試しください。

hirokazu.kobayashi

慶應義塾大学卒業後、2014年より株式会社リブセンスへ入社。データエンジニアとして同社分析基盤立ち上げをリードする。2017年より現職primeNumberに入社。自社プロダクト「systemN」におけるSpark/Redshift活用等のデータエンジニアリング業務を行うかたわら、データ統合業務における工数削減が課題だと感じ、データ統合を自動化するサービス「trocco®」を立ち上げる。