データサイエンティストの役割 (Sequoia Capital)

f:id:foundx_caster:20200520000249p:plain
データに基づく製品を構築するには高度に機能するデータ担当組織が必要となりますが、そのデータ担当組織はさらに、高度に有能なデータ専門家を必要とします。それは、企業のデータ文化を構築して形にする人々であり、そのデータ文化が全社に製品戦略を伝え、重要な意思決定を方向づけます。

データ担当組織のメンバーは、企業の成熟度やデータチームの権限により様々に異なりますが、通常はデータエンジニア、インフラアーキテクト、機械学習エンジニア、製品アナリスト、データサイエンティストなどの組み合わせから成ります。

この記事では、データサイエンティストたちのこなす様々な役割、そしてそれぞれの役割を上手くこなすために必要となるスキルについて、紹介していきます。また、データサイエンティストの雇用に関するよくある落とし穴や誤った通説のいくつかについても触れていこうと思います。データエンジニアなどの他の職務や、それらに必要なスキルセットについては、また別の記事で紹介していきます。

5つの核となるスキル

良いデータサイエンティストにとって必要な、5つのコアスキル及び能力があります。複雑なビジネス上の問題の構成要素を分解・特定する能力、データを抽出して操作するテクニカルスキル、データから価値を抽出する分析能力、そしてその分析結果を明確にまとめて伝達する能力が必要となります。これらの核心的スキルがどのように関連しているかを紹介します。

各スキルを詳しく見ていきましょう。

f:id:foundx_caster:20200520000639p:plain

  1. 問題の定式化。データサイエンティストは、問題を定式化・構造化できなくてはいけません。これには適切なビジネス上の疑問を立てることにより、複雑なビジネス上の問題を細かい要素に分解することが要求されます。疑問を立てるためのプロセスの多くには好奇心が必要となり、それが仮説を生み出すことにつながります。すると、これらの業務質問を一式のテクニカル問題として提示することができます。
  2. テクニカルな能力。業務上の疑問がテクニカルな問題として提示されたら、コーディング、統計、数量的能力がデータ抽出のために必要となります。このプロセスは反復的なものとなるかも知れません。疑問のいくつかは、データがないなどの複数の理由により、答えられないものであったりするからです。
  3. 分析能力。すべてのデータがそろったら、データサイエンティストは、データセットを抽出して操作したり、データを表や図などにまとめて価値を引き出したりする能力が必要となります。
  4. まとめる能力。データ分析の成果物は数字や図表ですが、データサイエンティストは分析したすべての情報を、当初定式化した問題に立ち返って関連付けていかなければなりません。結果を解釈し、簡潔化してまとめる必要があります。この段階での成果物は、最小限の画像、表、数値へと簡潔化することです。
  5. 影響力。ビジネス上の問題を実行可能な具体的洞察(決定)に結び付け、ストーリーとして語ることでそれらの決定に影響力を与えることが、効果を及ぼすために重要です。説得力のあるストーリーを語るのは、口頭でも文書でも、両者の組み合わせでも構いません。ストーリー全体を簡潔に語り(1ページの文書にまとめる)、本当に重要なことは箇条書きにし(エグゼクティブサマリー)、用いたデータではなくデータから出てきた知見をわかりやすく伝えること、これらはすべて必要となる重要なスキルです。

ほとんどのタイプの問題については、ジェネラリストに求められるスキルで十分です。しかし特定のタイプの分析的問題には、ある種の専門性を要求するものもあります。専門家の役割や責任でさえ、ジェネラリストに求められるものとそれほど多くの違いはありません。そしてほとんどの場合、あるスキルが他のスキルに比べて優れていれば十分です。

データサイエンティストの役割と責任

データサイエンティストの役割は、扱う製品のタイプや成熟度によって異なります。製品開発の初期段階でのデータサイエンティストの役割はどれも同じようなもので、基本的にコンピューターインフラや解析インフラの設定に重点が置かれます。製品が進化するに連れ、データサイエンティストの役割には製品チームのニーズによる違いが出てきます。

一般的に言えば、データサイエンティストは6つのカテゴリーに分類されます。

  1. 製品ジェネラリスト 製品に生じる広範な問題に対処する。
  2. 初期段階の製品アナリスト 初期製品に製品市場がフィットするかを判断する。
  3. グロースアナリスト 数字に表れる結果を出す。
  4. コアマーケットプレイスアナリスト プラットフォームの健全な流動性に責任をもつ。
  5. エコシステムアナリスト 競争の脅威や戦略的機会を特定する。
  6. 機械学習アナリスト 製品に供給するアルゴリズムの健全な作動に責任をもつ。

製品ジェネラリスト

当然のことながら、製品ジェネラリストには多くの場合、データサイエンティストを雇います。広範囲のスキルセットがあれば、広範囲の機能や問題を担当できるからです。製品ジェネラリストの基本的役割は情報を伝え、人を動かし、支援し、製品に関する決定を下すことです。高度なレベルになると、製品の目標、ロードマップ、戦略の設定や、製品の運用の実行を支援します。より具体的には、製品ジェネラリストは以下のことをします。

製品の成功を定義:製品チームのために重要な数字や到達点を決定・評価します。

製品の健全性をモニタリング:ダッシュボードやレポートを構築し、数字の変化の根本原因を理解し、一連の行動指針を提案します。これには以下が含まれます。

  • 正しい数字が追跡されていることを確認する(ユーザー、メッセージ、投稿、購入の測定など)。
  • データ分析を支援する堅固なインフラを構築する。
  • 数字が正しくカウントされるべく生データや派生フィールドを検証することによりデータの整合性を確証する。
  • ダッシュボードや他の報告ツールを通して重要業績評価指標(KPI)をモニタリングする。
  • 問題を診断してソリューションを提案する。ターゲット設定、予測、変則的な動きの調査、数字の変化の直接原因の把握、それらの変更の根本原因の診断など。(それらは行動の変化なのか、混合要因があるのか、データ問題か、製品変更か、あるいは季節性に関連しているのか日本語訳))
実験や製品をデザイン、評価し、市場に送り出す。
  • マーケティング、設計、製品、エンジニアリングの各部署と綿密に連携して、適切な実験を設計し、既存製品の特質と将来の変更とのインパクトを数値化し(A/Bテスト)、実験結果に基づいた提言をする。
  • データエンジニアリングチームと連携し、新たな分析ツールやモジュールを開発・導入したり、分析を拡張したりする。データエンジニアリングチームやデータインフラチームと提携して、製品ロードマップの構築を支援する。
製品のロードマップや戦略を設定する。
  • 探索的分析ができるように重要なデータセットを構築し、製品ロードマップの設定を支援する。
  • 探索的分析を実行して(製品、ユーザー、買収ルートを完全に把握するためにトレンドやパターンを分析・解釈する)、問題や新たな機会領域を発見し、仮説を立て、製品の変更や改善の優先づけをする。
  • データに基づく提言をして製品チームを動かす。

初期段階の製品アナリスト

初期段階の製品アナリストの第一の役割は、プロダクト・マーケット・フィット(PMF: 自社の製品が市場に適合していること)があるかどうかを判断し、もしあると判断した場合には、製品を気に入ってくれるユーザーの特質を特定することです。初期段階の製品アナリストの専門知識を活かすカギは、適切なインフラを構築して彼らがこれらの質問に答えて事業拡大につなげられるようにすることです。

初期段階の製品アナリストの役割と責任を下に挙げます。製品ジェネラリストと重なる部分が多くあります。重要な違いは、彼らが重点を置くのは適切な数字を定義・追跡し、データに整合性をもたせることであって、目標や実験を設定することではないという点です。それらは製品開発のもっと後の段階ですべきことになります。

  • 製品の健全性をモニタリングする。
  • 製品や事業について適切な重要業績評価指標(KPI)を設定することにより、製品の成功を定義づける。
  • 探索的データ分析を通して、初期のプロダクト・マーケット・フィットがあるかどうかを特定する。
  • 製品チームのために理想的な製品ユーザー像を構築して、初期の製品ロードマップの推進を支援する。行動分析を通してユーザーの特質を深く理解する。一般的にこの段階の分析の多くは、トップダウン型ではなくボトムダウン型になります。トップダウンのユーザー細分化をするにはデータが少なすぎるからです。

初期段階の製品アナリストは、データパイプライン、ストレージ、ソフトウェアエンジニアリングの基本を理解するだけの十分なテクニカル能力がなくてはなりません。なかには分析やデータパイプラインを自動化することに努め、自分たちの仕事から永続的な価値を生み出そうとする人々もいます。しかし初期段階の分析アナリストのインパクトは、トップのテクニカル能力をもつ人々でさえ、ある種の非テクニカルスキルがなければ切れ味が悪くなります。たとえば製品に照らした適切な質問をする能力や、分析結果を行動に結びつける能力などです。そしてただ面白いだけではなく、役に立つ洞察をもたらすのでなければなりません。これは、初期段階の製品アナリストのスキルと製品ジェネラリストのスキルとの共通する部分です。

f:id:foundx_caster:20200520002409p:plain


グロースアナリスト

グロースアナリストの第一の役割は、数字で把握できる成長を実現することです。測定するのは、ユーザー、開発者、支払者、広告主、コンテンツクリエイター、その他ビジネスに有用なものにまつわるデータの数字です。結局のところこれは、どのような現象をも深く理解し、問題圏に関連する問題や機会を掘り起こし、問題の主要原因を特定し、改善策を提唱することによってなされます。具体的には、グロースアナリストは次のことをする必要があります。

  • 製品の成功を定義づけ、製品の健全性をモニタリングする。適切な数字を特定・追跡したり、コンバージョンや機会を理解するために成長会計ファネルを構築するなど。
  • 製品の目標とロードマップを設定し、その両者に沿って製品を最適化する。
  • 社内に、データ・インフォームド型成長の文化を構築する。

グロースアナリストは、事象を高度に定量化し、ビジネスの変化要因を深く理解することによってビジネスの実情を正確に把握している必要があります。また、強い成長マーケティングの発想、探索的分析の能力やロードマップを特定する能力、そして絶え間なく小さな向上を重ねてやがて大きな積み重ねを築く反復的なアプローチを必要とします。有能なグロースアナリストはまた、統計学や実験計画法の知識もなければいけません。成長を遂げる良いチームは、実験から学ぶ強い哲学を持ち合わせているものだからです。

機械学習アナリスト

機械学習アナリストの基本的役割は、機械学習を通して製品を向上させる機会を特定することです。その基本的役割はモデルの構築ではなく、製品の健全性をモニタリングして提言をすることです。そのためには、根本原因を特定し、データ品質向上、新機能の追加、アルゴリズムの改良、適切な目的関数やトレードオフの見極めなど、改善できるエリアを提案します。具体的には以下の通りです。

  • 適切な目的関数を提案することで成功を定義づける。目的関数が間違っていると、製品の真の成功に到達することはできません。
  • 適切な数字を特定・追跡し、根本原因分析の実施枠組みを構築することで、モデルの健全性をモニタリングする。モデル性能についてギャップ分析(現実とモデル期待値との差の測定)を実施する際には、MECE(「それぞれが重複することなく全体として漏れがない」)体制で臨むことが重要です。モデル性能に影響を与えるものを特定し、それらの根本原因と結びつけることができます。それらは一般的に、データ品質、操作効率、アルゴリズム、特徴量エンジニアリングだったりします。
  • 目標を設定する。製品ロードマップはしばしば、根本原因の解析フレームワークから機会を特定することで設定されます。
  • 説明不能だったものを説明可能にし、適切なトレードオフを下すことで、より良い決定につなげる。広く採用されているにもかかわらず、機械学習モデルはほとんどブラックボックスのままです。予測が行われた原因を理解することは、透明性、予測の向上、ビジネス決定のために重要です。ビジネス決定のひとつにトレードオフがあります。その例として挙げられるのは、探索と深化のトレードオフ、あるいは適合率と再現率のトレードオフなどです。機械学習アナリストは、製品や会社を成長させるためにはどちらのトレードオフを下すか、必要な原則に基づいたアプローチをして、説明可能にすることが重要です。

製品ジェネラリストに要求されるすべてのスキルに加えて機械学習アナリストは、統計学、機械学習、枠組みの探査、根本原因の解析、最適化などが得意である必要があります。

マーケットプレイスアナリスト

マーケットプレイスアナリストの第一の役割は、効率を向上させて市場の価値を最大化することです。多くのコンシューマー・テクノロジー企業は、ツーサイド・マーケット企業であると考える日本語訳)ことができます。それらは基本的に、2つ(あるいはそれ以上)の異なるタイプの関連顧客の間で、直接のやり取りを可能にすることで、価値を生み出しています。PayPal、eBay、Uber、YouTubeなど、多くの製品がツーサイド・マーケットです。

市場の問題は、供給、需要、流動性という3つの部分に簡略化することができます。マーケットプレイスアナリストの役割は、それら各々を推進するものを理解して機会を特定することです。市場チームには3つのタイプのアナリストが必要となります。

  • グロースアナリスト — 供給と需要はそれぞれ個々に、成長問題として提示することができます。たとえば、供給サイドに測定すべき数字があり(運転手数など)、需要サイドにも別の数字があり(乗客数など)、それらをグロースアナリストは成長させようとします。
  • 機械学習アナリスト — 機械学習チームもまた、照合アルゴリズムを使ってルーティングを最適化する必要があります。つまり市場チームには、機械学習アナリストも含まれるということです。
  • 中心的マーケットプレイスアナリスト — 市場チームにはまた、中核となるマーケットプレイスアナリストが必要となります。その役割は、市場の供給サイドと需要サイドの相互作用を理解し、市場全体の流動性と効率性を向上させることです。

中心的マーケットプレイスアナリストは、以下のことに精通している必要があります。

  • 製品の健全性をモニタリングし、需要と供給を関連づける適切な数字を特定・追跡することにより、製品の成功を定義づける。たとえば小売り比率や適切な目標設定など。
  • 供給と需要に関する情報の利用法を理解し、どちらか、あるいは両方が制約されている部分、もしくは十分最適化されていない部分を見極め、製品ロードマップを設定する。

製品ジェネラリストが持つべきすべてのスキルに加えて、中心的マーケットプレイスアナリストは、経済 (特に供給と需要)、最適化、ネットワーク効果、市場ダイナミクスなどを深く理解している必要があります。

エコシステムアナリスト

エコシステムアナリスト は、市場トレンドを分析し、製品の市況を製品部門のリーダーたちに伝えることで、事業や製品戦略の推進を支援します。これらの市場トレントは社内的なものもあれば(社内製品のユーザーたちがどれくらいモバイル端末のほうをより利用しているかなど)、社外的なものもあります(競合他社の影響など)。具体的には、エコシステムアナリストは次のようなことをします。

  • 市場トレンド、顧客行動、競合相手の動向についての重要な洞察を提供することで、製品ロードマップを設定し、それの促進を支援する。
  • 次のことにより製品戦略を促進する。1)ビジネス生態系の様々な部分がどのように相互作用しているかについての深い理解に基づき、特定の製品戦略のビジネスケースを構築する(たとえば、コンテンツ制作が最終的に活発な利用を促進すると知ることで、コンテンツ制作に重点を置いた提唱へとつながる)。 2)市場調査や市場での競合相手に関する調査を実施し、関連ベンチマークを構築することにより、競合他社に関するモニタリングと分析をして重要な機会を特定する。
  • 市場、機会の規模、製品の相乗効果に着目して新たなビジネス構想事例を構築することにより、ビジネス戦略を推進する。(たとえば、10代のモバイル端末の利用が急激に増えていると知ることで10代向けの新たなモバイル製品の提唱につながる)。
  • 競合相手や戦略的利益が潜む分野を常にモニタリングすることで、潜在的な吸収合併のターゲットを特定する。

良いエコシステムアナリスト は、領域を深く理解し、自身の洞察を部門を超えた複数のパートナーに効果的に伝え、市場や競合相手の調査をするスキルを備えています。

結論

  • データサイエンティストの役割は、データ分析からの洞察を活用して、製品決定の促進を支援することです。
  • データサイエンティストには6つのタイプがあります ― 製品ジェネラリスト、初期段階の製品アナリスト、グロースアナリスト、コアマーケットプレイスアナリスト、エコシステムアナリスト 、機械学習アナリスト。
  • データサイエンティストには5つの核となるスキルがあります ― 問題の定式化、テクニカルな能力、分析能力、まとめる能力、影響力。

本稿は、Sequoia Capitalのデータサイエンス・チームによるものです。Chandra Narayanan、Hem Wadhar、Ahry Jeonが記事を執筆しました。データサイエンスの全シリーズはこちらでご覧になれます。ご質問やご意見やその他感想がありましたらdata-science@sequoiacap.comまでメールください。

 

記事情報

この記事は原著者の許可を得て翻訳・公開するものです。
原文: Role of a Data Scientist (2019)

 

関連記事

FoundX Review はスタートアップに関する情報やノウハウを届けるメディアです

運営元