なぜデータ活用はデータの専門家任せにしてはいけないのか。『実践DataOps』翻訳者に聞く“組織的なデータ活用の第一歩”

2024年5月28日に発売となった『実践DataOps』。2019年に出版された『Practical DataOps: Delivering Agile Data Science at Scale』の邦訳書です。データ活用領域のコンサルティングを手掛ける丸山 大輔さん、松田 和雄さん、關 哲也さんによって翻訳されました。

DataOpsは、データ活用の包括的なアプローチです。組織でデータ活用を進める上で必要なことがまとめられています。しかし、まだ新しい概念であるため、耳慣れないという方も少なくないでしょう。本書の特徴はデータ活用の技術的な方法論だけを解くのではなく、データ活用を組織的かつ継続的な取り組みにするための包括的かつ体系的なステップとノウハウを説いています。今回は翻訳者の一人である松田さんに本書の概要を伺いました。

DataOpsの戦略的意義から実践まで、体系的に学べる一冊

――DataOpsとはどのような取り組みか教えてください。

松田 DataOpsは、組織全体でデータを効果的に活用し、新しいビジネス価値の創造のための包括的なアプローチです。似たような言葉としてDevOpsやAIOpsといった言葉があります。いずれも「Ops=Operations(運用)」という言葉が共通しており開発だけでなく運用にも焦点を当てることが多いのですが、ことDataOpsに関してはより幅広く、組織全体のデータ活用戦略から具体的な実践までをテーマとしているのが特徴です。

これまでは、システムを動かすためにデータを取得したり、データを生み出したりしていました。それらのデータはビジネスでの活用を想定していないため、そのままの形ではビジネスで価値を生み出すのは難しいという現実がありました。

データを活用しビジネスで価値を生み出すには、データを集めてから何をしようか考えるのではなく、最初に達成したい未来や目標を定めることが重要です。未来や目標を定めた後、データを達成するための手段として捉え、どのようなデータをどう使うかを検討し、データを集めた方がビジネス価値に繋がりやすくなります。

そうした組織全体のデータ活用戦略とその実践には、組織横断的な協力が欠かせません。

―― 技術的側面だけでなく、組織的、ビジネス的な側面でも重要な取り組みなんですね。では『実践 DataOps』という本の概要について教えてください。

松田 『実践 DataOps』は、DataOpsという概念を包括的に解説した書籍です。

本書では、システム開発やデータ分析の技術的な側面だけでなく、データ活用の目的設定から組織づくり、実際の運用まで、幅広い範囲をカバーしています。これは、DataOpsが単なる技術的な取り組みではなく、組織全体で取り組むべき課題であるからです。原著者のHarvinder Atwal氏は、20年以上にわたりデータアナリティクスの分野で活躍してきた経験豊富なデータサイエンティストです。本書には、彼が長年のキャリアを通じて培った豊富な知見が凝縮されています。

本書は4つのパートに分かれています。

パート1ではDataOpsの序論として、データサイエンスの問題点とデータ戦略の重要性などを説明しています。

パート2で解説しているのは、DataOpsの基本となるリーンシンキングやアジャイルの考え方、DataOpsの効果測定とフィードバックの仕組みづくりです。

そして、パート3とパート4では、さらなるステップとしてDataOpsの実践に向けた具体的なアプローチについて解説しています。

―― 他のデータ活用に関する書籍との違いはどのような点でしょう。

松田 類書と異なる点は、大きく三つあります。

まず、本書がDataOpsに関する包括的な解説書として貴重な存在だということです。DataOpsに関する書籍自体が非常に少ない中、本書は全体像を把握するのに適しています。実際、本書の翻訳が決まったころは、日本語でDataOpsを検索してもほとんど情報が出てこないような状況でした。

次に、戦略的な視点からデータ活用を論じている点です。多くのデータ関連の書籍が特定の技術やツールに焦点を当てているのに対し、本書は組織全体でのデータ活用の戦略的位置づけを明確にすることから始めています。

最後に、実践的な取り組みを紹介している点が挙げられます。本書では、DataOpsの全体像だけではなく、システム設計や組織づくりなど、具体的な課題解決のヒントが提供されています。その他、よくある失敗パターンとその回避方法の解説、DataOpsの実践に必要なツールや技術の選定指針もわかるようになっています。

このように、本書はDataOpsの方法論の説明から実践までを提供しているのが特徴だといえます。

―― 本書はどのような人を対象に書かれているのでしょうか。

松田 対象読者は幅広い層を想定しています。主なターゲットは、データ活用の仕組みを整備する人、データを活用してビジネス価値を生み出そうとする人です。

また、プロジェクトのオーナーや経営層の方々にもぜひ目を通してほしいです。DataOpsの実践には組織全体の理解と協力が不可欠であり、トップダウンの支援が重要です。

さらに、データ活用に直接関わっていないエンジニアの方にも読んでいただきたいですね。将来的に必要な知識となるはずです。

「データ活用の問題を解決できる本」感じた日本語訳の必要性

―― 松田さんが原著と出会ったきっかけを教えていただけますか。

松田 2021年10月頃、職場のチームメンバーが『Practical DataOps』という本を見つけてきました。内容を確認していくうちに、これまでデータ活用のプロジェクトで悩んでいた部分に対する解決策が書かれていることに気づいたんです。

最初は社内の参考資料として使うつもりでしたが、内容の有用性が高く、日本語で広く読まれるべきだと強く感じ、翻訳出版のプロジェクトが始まりました。

―― 翻訳作業で苦労したことを教えてください。

松田 まず、原文に外国特有のわかりづらい例え話が随所に登場する点です。日本の読者に伝わりやすい表現に置き換えるのに苦労しました。また、著者独特の文体や表現のクセが強く、わかりやすい日本語に直すのも大変でした。

さらに、英単語の表記に揺れがあったため、文脈を踏まえたうえで表記を統一する作業も必要だったこと。加えて、日本での出版において炎上のリスクがある記載も見られたため、出版社と慎重に検討したうえで、一部の記述を削除するなどの対応を行いました。

苦労は大きかったのですが、原著の意図を損なわず、かつ日本の読者にとって理解しやすい翻訳を心がけました。

まずは小さく始める。日本におけるDataOpsの現状と成功のポイント

―― 日本におけるDataOpsの現状はどのような状況なのでしょう。

松田 正直なところ、DataOpsが現場で浸透しているかというと、まだまだだと思います。DataOpsに含まれる取り組みは進んでいますが、データの品質管理やシステム開発・運用の効率化など部分的な取り組みが多い印象です。

また、データ分析やAI活用といった「派手な」部分に注目が集まりがちです。しかし、そのためのデータ収集や前処理、データ品質の維持や改善などを継続的に行うための仕組みづくりといった「地味な」部分にはあまり注意が払われていない状況です。

―― DataOpsを実践する上で、特に難しい点はどこにありますか。

松田 一番の難しさは、組織全体を巻き込む必要があるという点です。特に大企業になればなるほど、部門間の距離が遠くなり、全体像が見えにくくなります。

また、多くの企業で見られるのが、大規模なデータ基盤を構築することから始めてしまうケースです。むしろ、必要な機能だけで構成される最小構成から始め、必要に応じて機能拡張していく方が効果的です。

さらに、DataOpsの実践には、技術的なスキルだけでなく、ビジネスへの理解や、コミュニケーション能力など、幅広いスキルが必要となります。そのような人材の育成や確保も大きな課題となっています。

―― 組織の規模によってDataOpsの実践のしやすさは変わってくるのでしょうか。

松田 変わると思います。スタートアップのような小規模な組織では、全員が一つのテーブルを囲んで素早く動けるので、DataOpsの実践はそれほど難しくありません。一方、部門数が多い大企業ほど、実践が難しくなるでしょう。

大企業では部門間の壁が高く、データの所有権や利用権限の問題、セキュリティの懸念など、さまざまな障壁があります。また、既存のシステムやプロセスが複雑に絡み合っているため、変革を行うのが難しいです。

だからこそ、組織全体でデータを効果的に活用しビジネスに新たな価値を創造するためにも、DataOpsは大企業において重要性が高いと言えます。組織の壁を越えてデータを効果的に活用する方法を考え、実践していく必要があるのです

―― DataOpsを成功させるためのポイントを教えてください。

松田 ポイントは4つあります。まず、明確な目的を設定すること。無駄なコストを避けるためにも重要です。

次に、小さな課題から始めることです。小さな困りごとの解決から始め、成功体験を積み重ねることでより大きな課題に取り組むことができる環境が構築できます。このとき、現場の人が直接恩恵を感じられるような取り組みから始めるとよいでしょう。

また、効率化から着手するのもポイントです。例えば、Excelでのレポート作成工程の自動化などです。この自動化で浮いた時間や費用で、プロトタイプを作ってみてはどうでしょうか。

最後に、過剰投資を避けるのも重要です。いきなりTableauのような高価なツールを採用するのではなく、まずはExcelなど既存ツールの活用から始めましょう。

本書を読んで、DataOps実践への第一歩を踏み出してほしい

―― 本書を読んだ後、読者にチャレンジしてほしいことはありますか。

松田 まずは身近なところからDataOpsに挑戦してみてほしいですね。例えば、エンジニアであればCI/CDの一部でもいいから手に届く範囲で自動化を進めてみることも良いと思います。業務部門の方であれば、Power Automateなどを使って自分の業務の一部を自動化してみることも有効だと思います。

どの立場の人であっても、少しずつ手の届く範囲でDataOpsの実践を試みて、効果を示していくことが重要です。

そのためにも、本書をデータ活用の考え方や進め方の判断基準として使ってほしいですね。

チーム内で本書の内容を共有し、議論のベースとして使うのも効果的です。

―― 最後に、これからDataOpsに取り組もうとしている方々へメッセージをお願いします。

松田 データ活用の成否が企業の競争力を左右する時代になっています。そのためにDataOpsの導入は非常に重要な取り組みです。

ただし、一朝一夕には実現できません。小さな一歩から始めて、少しずつ前進していってください。そして、決して一人で抱え込まず、組織全体を巻き込んでいくことが大切です。

この本が、皆さんのDataOps実践の道しるべとなれば幸いです。

執筆:河原崎亜矢