データサイエンスを機能させる (Sequoia Capital)

f:id:foundx_caster:20191129032307p:plain

接続性の向上、クラウドストレージとコンピューティングのコスト低下、および大規模なターゲットオーディエンスにリーチできる配信プラットフォームへのアクセシビリティのおかげで、テクノロジー企業を立ち上げ、優れた製品を構築することが容易になりました。こうした参入障壁の低さが、テクノロジー企業の急増を招いています。この増加によって大量のデータが生成されているため、データの使用方法に重点を置いた複数の新しいデータ分野が開発されています。

データインフォームド(訳注:データに基づく)文化を持ち、データを活用して成果を推進する企業が、これまでになく競争上の優位性を獲得しています。成功を促進するデータインフォームド文化は、データの正しい価値を強調し、優秀なデータサイエンティストを採用して育成する企業のリーダーシップから始まります。

データサイエンスに関する最近のシリーズでは、成功する企業を構築するために、データインフォームド文化の重要性について深く掘り下げています。製品と企業の成熟に伴う、パフォーマンスの高いデータサイエンスチームの重要性日本語訳)と、その進化日本語訳)について説明しました。また、分析チームから最高の成果を上げるためにはどのように会社を作る日本語訳)か、そのためにはなぜ世界クラスのチームを構築する日本語訳)必要があるのか、データサイエンティストの役割日本語訳)を適切に定め、適切な人材を雇用日本語訳)し、データサイエンティストに適切な進歩日本語訳)の機会を提供し、管理する日本語訳)ことが、データチームから最大の競争優位性を得るためにいかに重要であるかについても説明しました。

この最後の記事では、これらの要素がどのように組み合わさり、成功する会社を作ることができるのかを見ていきます。

世界トップクラスのデータインフォームド企業の特徴

成功へ向けて会社を設立することが最も重要なことです。データインフォームド文化が最も強い日本語訳)企業は、次の6つの特徴を示します。

  1. インパクトを与えることにフォーカスしているーインパクトはすべての分析の共通項です。インパクトへ向けて定義を行い、測定し、実行しなければ、企業は舵のない船も同然です。インパクトは優先順位付けに役立ち、方向性を定めることができます。
  2. アジャイルインフラストラクチャ:優れたインフラストラクチャはアジャイルであり、将来の需要に適応できます。短期的なニーズのためだけにインフラストラクチャが最適化されている企業は、拡張に失敗することが多いです。慎重に構築されたインフラストラクチャがなければ、チームはビジネスにインパクトを与える現象を理解する能力が遅れたり、最悪の場合、まったく理解できなくなります。
  3. 実験の文化:直感は製品を作る上で非常に価値あるものですが、拡張性はありません。データインフォームド企業は、直感を仮説と実験的設計に体系化して、強力な「テストと学習」文化を確立する必要があります。このテストと学習の方法論の根底にあるのは、毎週小さな改善が積み重なると、まれに発生する大きな改善よりも遥かに大きなインパクトが生まれるという事実です。
  4. 分析チームの幅広い視点:真に優れたデータインフォームド企業を構築するためには、分析を製品開発のあらゆる段階で行い、製品チームに組み込む必要があります。最初に、分析チームは、製品の成功に関連する指標を作成し、継続的に進捗を測定し、ビジネスのリスクと成長分野の特定を支援する必要があります。分析チームを最もレバレッジの大きい問題の解決に使用し、最大の効果をもたらすようにすることが重要です。製品の目標、ロードマップ、および戦略の推進に役立てなければなりません。
  5. 厳格なロードマップ・プロセス:迅速な製品開発、テスト、反復には、効率的なロードマップ・プロセスが必要です。このプロセスには、ロードマップの設定を含め、製品開発のすべての段階で分析を行う必要があります。迅速な製品開発へ向けた適切なロードマップ・プロセスがなければ、実行が制約を受けてしまいます。
  6. 適切な採用とエンパワーメント:プロダクト分析はまだ発展途上にある初期段階の業務です。データ・サイエンスとデータ・エンジニアリングの両者は、最先端の企業においてですら、自分の居場所を見つけようと努力し、ビジョンを修正し続けています。その結果、経験豊富なリーダーが少ないため、分析においてワールドクラスのチームを構築する日本語訳)ことは、他の業務よりも難しいことです。ワールドクラスの組織を構築する際には、人材、文化、プロセスという、特に重要な3つの要素を考慮する必要があります。A級プレイヤーを雇い、素晴らしい仕事をできるよう励まし、将来のリーダーとして指導することでインパクトを高めることが重要です。そのためには、企業とチームはそれぞれの人材に目的を持って活動させる必要があります。また人材をより卓越したレベルへと高めるボトムアップ型の文化を育むことや、説明責任、オーナーシップ、信頼をコアバリューとする強力で透明性のある組織を構築すること、そして企業第一、事業部第二、チーム第三、個人が最後の文化を創造することが必要です。

データによる主な成果

今日の企業の競争力は、玉石混交のソースに由来する、膨大かつ構造化されていないデータセットに対し、いかに分析を正しく適用して製品イノベーションを推進しているか、その度合いによって測ることができます。そのため、データサイエンティストの需要は高く、賢いデータサイエンティストのチームにより、製品の成否が決まることもあります日本語訳)。データマイニングで洞察を得ることへの関心が高まっており、製品チームは4つの具体的な成果日本語訳)に的を絞り、データを利用すようになりました。

  1. ビジネスの健全性を評価する:製品分析の主要な成果の1つは、製品またはビジネスの健全性を評価することです。製品の成功を目標と指標によって定義したら、次のステップは、目標を確実に達成するために指標を監視することです。戦術的には、アナリストは外れ値を特定し、指標の変化の要因を理解し、ダッシュボード、レポート、視覚化を構築します。
  2. 適切な製品や機能を届ける:分析のもう1つの重要な役割は、適切な製品や機能を確実に構築することです。多くの企業は、多数の実験を行い、その実験結果を評価したのち製品を出荷しています。通常、データサイエンティストは、実験の設計や、現象に対するデータインフォームドな仮説の特定、データへの洞察を通した製品の継続的な最適化について製品チームの指導を行います。
  3. 成果を予測し、生産システムを稼働させる:データサイエンティストのもう1つの役割は、AIと機械学習を使用してプロトタイプとモデルを構築し、生産システムを稼働させることです。これらのデータサイエンティストは、将来の期待と傾向を予測するため、現象について機械学習モデルを訓練します。
  4. 製品のロードマップと戦略を定める:ユーザージャーニーと現象のより深い探究と分析は、最終的に製品のロードマップと戦略を設定することに繋がるアクショナブルな洞察を生み出します。データドリブンなロードマップと戦略は、製品分析チームの最も重要な成果の1つです。

データ組織 

これら四つの主要なデータ成果は、新製品と、データスタックの複数の部分(下の図1を参照)に焦点を当て、洞察の発生と素晴らしいデータドリブン製品の構築を最大化する業界全体を生み出しました。

f:id:foundx_caster:20191129033807p:plain

図1

データスタックが標準化されるにつれて、データアナリスト、データエンジニア、データインフラエンジニア、データアーキテクト、データサイエンティストなど、複数のデータ関連の専門職が登場しました。企業は成熟度(表1参照)に関して異なる発展段階にあります。たとえば、自分のサイトを訪問したアクティブユーザー数を正確に把握するために、数字を数えるだけの企業もありますし、ビジネスの健全性を評価するダッシュボードを構築する企業もあります。データドリブンの傾向が強い企業は、適切な製品を出荷するために試行錯誤を行い、最先端の企業はデータを使用して自社製品の目標、ロードマップ、および戦略を推進します。

f:id:foundx_caster:20191129033906p:plain

表1

データサイエンティストのスキル

また、データの4つの成果から、業界内の2つの異なるタイプのデータサイエンティスト、つまり製品アナリストとアルゴリズム開発者が生まれました。製品アナリストは、製品や戦略の変更を支持するデータドリブンなストーリーを提供し、アルゴリズム開発者は、提案内容や検索結果の最適化など、データドリブンな機能を製品に組み込みます。

データサイエンティストは、学士号、修士号、MBA、博士号レベルの新卒者、または製品、技術、コンサルティングの経験豊富な専門家からなります。彼らは様々なスキルを持っており、様々な問題を解決するために、彼らをうまく組み合わせることは価値があるでしょう。一般的に言って、データサイエンティストが提供するスキルには3つのタイプがあります。それは、科学的厳密さ、コンサルティングのマインドセット、プログラミングの強みです。これらはすべて、以下の5つの問題解決と分析の次元に適用されます。

  1. 課題の定式化:データサイエンティストは問題を定式化し、構造化できなければなりません。これには一般的に、問題解決のための科学的アプローチに加え、コンサルティングのマインドセットが必要となります。
  2. 技術的能力:データの抽出には、プログラミングと科学のスキルの両方が必要です。
  3. 分析能力:データを抽出して操作したり、表やチャートなどの形でデータから値を抽出したりするには、分析スキルが必要です。データを理解するには、コンサルティングのマインドセットと問題解決のための科学的アプローチが必要です。
  4. 統合:データサイエンティストは解析結果を解釈し、単純化し、統合する必要があります。ここでは、コンサルティングのマインドセットが重要となります。
  5. 影響:データを使用してストーリーテリングを推進することで製品の意思決定に影響を与えることは、インパクトを作り出すために重要であり、またそのためにはコンサルティングのマインドセットが必要です。

データアーキタイプ

データサイエンティストは多様な問題を解決するため、次のようなデータサイエンティストの複数のアーキタイプが出現しました。

  1. 製品ジェネラリスト、製品に関する幅広い問題解決のために働く。
  2. 初期製品アナリスト、初期段階にある製品のプロダクトマーケットフィットを判断する。
  3. グロースアナリスト、指標を動かす。
  4. コアマーケットプレイスアナリスト、プラットフォームの健全な流動性を確保する。
  5. エコシステムアナリスト、競合上の脅威や戦略的な機会を見定める。
  6. 機械学習アナリスト、製品の原動力となるアルゴリズムの健全な動作を確保する。

データサイエンティストの採用 

データサイエンティストに万能的な役割を期待して雇っても上手くいきません。データ組織の規模と成熟度、製品チームのニーズ、データサイエンティストが解決する関連問題を考慮に入れることが重要です。それぞれのデータ・アーキタイプに必要なスキルを評価することで、優れた採用プロセスを構築できます。

ジェネラリストの雇用:ジェネラリストに対するインタビューループには、2つの分析的分解ケース、1つのプログラミングテスト、1つの応用分析、および科学的・定量的面接が必要です。

  1. 分析的分解ケース:これはもっとも重要な面接です。これに失敗する人は採用するべきではありません。このスキルを持つことの重要性は、以下のスキルをテストする二つの面接に値します。問題の定式化、コミュニケーションと明確さ、未開の分析能力、製品マインドセット、製品の成功と健全性。
  2. プログラミングテスト:これは、候補者のコーディングスキルをテストします。プログラミングテストには、候補者のプログラミングスキルにとって不利とならないように、単純なデータ収集(データを収集するための単純なプログラムの作成)と複雑なデータ収集(複合データ・セットを収集するための異種データ・セットの結合)を含める必要があります。
  3. 応用分析:これは、候補者が実際の問題を最初から最後まで解決できるかどうかを知るのに役立ちます。このテストでは、候補が問題を定式化し、データを収集し、操作し、統合を行うことができるかどうかを調べます。
  4. 問題の体系化:候補者は、問題を体系化することによってビジネス上の問いを解決することができるでしょうか。これには、データを取得するための単純なクエリーの作成、ビジネス上の問題に基づいたデータの操作、結果を明確に伝達するための結果の統合などが含まれます。
  5. 科学的、量的能力:この面接は、候補者が、特に数学に関して、必要な量的能力を持っているかどうかを評価します。統計分析に基づいた健全な意思決定ができるかどうかや、複雑なデータを分析するのに必要な科学的スキルを持っているかどうかです。

データサイエンティストのキャリアの進展 

キャリアの初期段階にいるデータサイエンティストは、特定のプロジェクトに対し最も大きな影響を与えます。彼らが成長するにつれて、その影響は特定の製品からドメイン全体へと広がります。最も上級のデータサイエンティストは会社全体に影響を与えるのです。

キャリアステージの違いによってデータサイエンティストは、5つのコアスキルや能力の中でそれぞれ異なる成熟度を保持しています。5つのコアスキルや能力については、データサイエンティストのキャリアの進展の記事日本語訳)で概説しましたが、次のようになります。問題の定式化、技術能力、分析能力、統合、そしてインパクト。その結果、より多くの下級データサイエンティストが、優れた働きを保証するために上級データサイエンティスト(とそのマネージャー)からのサポートと支援を必要としています。一般的に言って、データサイエンティストが上級であればあるほど、その影響は大きくなります。データサイエンティストが会社全体にインパクトを持つ場合(図2を参照)、プロジェクトレベルの場合よりも大きなインパクトを持ちます。

f:id:foundx_caster:20191129034745p:plain

図2

表2と表3は、下級および上級のデータサイエンティストのデータを示しています。主な違いは、独立性のレベルです。上級のデータサイエンティストは、この独立性によって会社全体における高品質な作業に対し影響を与えることができます。

f:id:foundx_caster:20191129034834p:plain

表2

f:id:foundx_caster:20191129034859p:plain

表3

データサイエンスマネージャーの役割

データサイエンス組織のインパクトを拡大するには、強力なデータサイエンス・リーダーが必要です。データチームのマネージャーが担う最も重要な2つの責務は、インパクトを高めることと、ワールドクラスのチームを構築することです。マネージャーは、高品質の成果物を生産し、優れた製品を構築することによって、持続可能なインパクトを推進する高パフォーマンスのチームを構築し、維持する必要があります。データチームのマネージャーは、大きく分けて次の5つのことに注目します。

  1. インパクトを与える:マネージャーはチームに最大のインパクトを与えることができるでしょうか?
  2. 人々の管理:チームには適切な人材が揃っていますか?彼らは幸せですか?彼らは必要な指導を受け、成長していますか?
  3. エクセレンスを推進する:チームの各メンバーはそのインパクトを最大化していますか?
  4. チームのスケーリング:チームは長期的にみて、どのように進化する必要がありますか?
  5. 製品リーダーシップ:マネージャーとして、製品の構築へ向けて最適な指示を与えていますか?

トレンドと未来

データサイエンスはまだ初期段階にある分野であり、この分野を継続的に形作る多くの新しいトレンドの影響を受けながら、時間とともに確実に進化していくでしょう。消費者と企業の行動は絶えず変化しています。例えば、世界中で利用できる帯域幅が増加すると、ビデオ消費量が継続的に増加しました。企業側では、クラウドコンピューティングの普及とSaaSアプリケーションの爆発的な増加が、企業アプリケーションの細分化につながっています。

他のほとんどの分野と同様に、人工知能と機械学習が原動力となって、データエンジニアや科学者の日常的なタスクを自動化する新製品が登場し、分野全体がより創造的でインパクトの大きい問題へ向けて押し上げられていくでしょう。その結果、インフラストラクチャ・レベル(例えば、時系列データベースの専門知識はリアルタイムとは異なる)から、ビジネス・コンテキストが数学的能力と同じくらい重要である最上位レベルの分析(例えば、成長に対するリスクを管理するための分析)まで、データ・プロフェッショナルの専門性が向上するでしょう。また、現在の視覚化とレポート作成も、よりストーリーを伝え、意思決定を重視するように進化するでしょう。

そのため、企業レベルでは柔軟性が鍵となります。将来を視野に入れたデータインフラストラクチャスタックの慎重な構築、製品ライフサイクルの各段階に応じた適切なデータ人材の雇用、そして分野を将来にわたり継続的に進化させることで、企業の成功に資することができます。

 

記事情報

この記事は原著者の許可を得て翻訳・公開するものです。
原文: Making Data Science Work (2019)

 

関連記事

FoundX Review はスタートアップに関する情報やノウハウを届けるメディアです

運営元