技術的なレベルでは、AIはソフトウェアの未来になりそうです。AIは様々な難解なコンピュータサイエンスの問題で目覚ましい進歩を見せており、その過程でソフトウェア開発者の仕事が根本的に変化しつつあります(たとえば、ソースコードと同じくらいデータを扱うようになりました)。
多くのAI企業(と投資家)は、この関係が技術だけにとどまらず、AIビジネスが従来のソフトウェア企業にも似てくることに賭けています。しかし、私たちはAI企業と仕事をしてきた経験から、そうではないと考えています。
私たちは、ビジネスを変革するAIの力を強く信じています。私たちはこの信念を背景に資金を投資しており、今後もAIを応用する企業とAIインフラストラクチャの両方に多額の投資をしていきます。しかし多くのケースで、AI企業はソフトウェア・ビジネスのような経済構造を持っていないことにも気づいています。時には、AI企業は伝統的なサービス企業のように見えることさえあります。多くのAI企業はこのような特徴を持ちます。
1.クラウド・インフラの多用と継続的な人的サポートのため、粗利が低い。
2.エッジケースという茨の道を歩む問題によるスケーリングの課題
3.AIモデルのコモディティ化とデータネットワーク効果(日本語訳)の課題による防御の壕 (moat) が弱い。
AI企業の財務データには驚くほど一貫したパターンが見られ、粗利益率は50~60%台であることが多く、同等のSaaSビジネスの60~80%以上というベンチマークを大きく下回っています。特に一部の投資家は収益性よりも成長性を重視しているため、アーリーステージの民間資本は短期的にはこのような非効率性を隠すことができます。しかし、長期的な製品や市場投入(GTM)の最適化をいくら行っても、問題を完全に解決できるかどうかは定かではありません。
SaaSがオンプレミスのソフトウェアに比べて新しい経済モデルをもたらしたように、AIは本質的に新しいタイプのビジネスを生み出していると私たちは考えています。そこでこの記事では、AI企業が従来のソフトウェア企業とどのように異なるのかを説明し、それらの違いに対処するためのアドバイスを紹介します。私たちの目標は、規定的なものではなく、むしろオペレーターやその他の人たちがAIの経済性や戦略的展望を理解し、永続的な企業を構築できるように支援することです。
しかし多くのケースで、AI企業はソフトウェア・ビジネスのような経済構造を持っていないことにも気づいています。時には、AI企業は伝統的なサービス企業のように見えることさえあります。
クリックしてツイートする
ソフトウェア+サービス=AI?
ソフトウェア(SaaSを含む)の優れた点は、一度生産して何度も販売できることです。このような特性は、定期的な収益の流れ、高い粗利益率(60~80%以上)、ネットワーク効果やスケール効果の影響を受ける比較的稀なケースではスーパーリニアなスケーリングなど、多くの説得力のあるビジネス上の利点を生み出します。また、ソフトウェア企業は、自社の業務によって生成された知的財産(通常はコード)を所有しているため、強力な防御的な壕 (moat) を構築する可能性があります。
サービスビジネスは、このスペクトルのもう一方の端を占めています。各新規プロジェクトには専用の人員が必要で、一度だけ販売することができます。その結果、収益は非経常的なものになる傾向があり、粗利益率は低く(30~50%)、スケーリングはせいぜい直線的なものになります。顧客が所有していない知的財産は広く適用できる可能性が低いため、ブランドや既存のアカウントコントロールに基づいている場合が多く、防御性はより難しくなります。
AI企業は、ソフトウェアとサービスの両方の要素を組み合わせることが多くなってきています。
ほとんどのAIアプリケーションは、通常のソフトウェアのように見えたり、感じたりします。ユーザーとの連携、データ管理、または他のシステムとの統合などのタスクを実行するために、従来のコードに依存しています。しかしアプリケーションの中心となるのは、訓練されたデータモデルのセットです。これらのモデルは、画像を解釈したり、音声を書き写したり、自然言語を生成したり、その他の複雑なタスクを実行したりします。これらのモデルを維持することは、時としてサービス・ビジネスのように感じることがあり、通常のサポートや成功のための機能を超えた顧客固有の作業や入力コストが必要となります。
このダイナミックな動きは、いくつかの重要な方法でAIビジネスに影響を与えます。以下のセクションでは、グロスマージン、スケーリング、防御力など、いくつかの点を探っていきます。
AI企業は、ソフトウェアとサービスの両方の要素を組み合わせて、グロスマージン、スケーリング、防御力を持つようになってきており、全く新しいクラスのビジネスになるかもしれません。
クリックしてツイートする
グロスマージン、その1。クラウドインフラは、AI企業にとって実質的なコストであり、時には隠れたコストでもある
かつてのオンプレミス型ソフトウェアの時代には、製品を提供するということは、物理的なメディアをスタンプアウトして出荷することを意味していました。今日では、SaaSの優位性により、そのコストはベンダーに押し戻されています。ほとんどのソフトウェア企業は、毎月大きなAWSやAzureの請求書を支払っています。
AIは、かなり要求が厳しいことがわかっています。
- 1つのAIモデルのトレーニングには、計算リソースに数十万ドル(またはそれ以上)のコストがかかることがあります。これを一回限りのコストとして扱いたくなりますが、AIモデルに供給するデータは時間の経過とともに変化する傾向があるため(「データドリフト」として知られる現象)、再トレーニングは継続的なコストとして認識されるようになってきています。
- モデル推論(本番で予測値を生成するプロセス)も、従来のソフトウェアを操作するよりも計算が複雑になります。長時間の行列の乗算を実行するには、例えばデータベースから読み出すよりも多くの計算が必要になります。
- AIアプリケーションは、従来のソフトウェアよりも、画像、音声、ビデオなどのリッチメディア上で動作する可能性が高いです。これらのタイプのデータは、通常よりも高いストレージ・リソースを消費し、処理にコストがかかり、関心領域の問題に悩まされることがよくあります。
- AI企業からは、クラウドの運用は従来のアプローチよりも複雑でコストがかかる可能性があり、特にAIモデルをグローバルにスケーリングするための優れたツールがないことが原因であると言われています。その結果、一部のAI企業は、信頼性、レイテンシ、コンプライアンスを向上させるために、訓練されたモデルをクラウドのリージョン間で日常的に転送しなければならなくなりました。
これらを合わせると、AI企業は収益の25%以上をクラウドのリソースに費やしています。極端なケースでは、特に複雑なタスクに取り組むスタートアップでは、訓練されたモデルを実行するよりも、実際には手動でデータ処理を行った方がコストが安いことに気づいています。
その助けとなるのが、より効率的に計算を実行できる特殊なAIプロセッサや、必要な計算回数を減らすモデル圧縮やクロスコンパイルなどの最適化技術です。
しかし効率化曲線の形状がどのようなものになるかはまだ明らかではありません。多くの問題領域では、精度を段階的に向上させるために、指数関数的に多くの処理とデータが必要になります。これは、これまで述べてきたように、モデルの複雑さが驚異的な速度で増大していることを意味し、プロセッサがそれに追いつくことはできそうにありません。ムーアの法則だけでは十分ではないのです。(例えば、最先端のAIモデルを訓練するのに必要な計算リソースは2012年から30万倍以上に増加していますが、NVIDIA GPUのトランジスタ数は4倍にしかなっていません!) 分散コンピューティングはこの問題に対する説得力のある解決策であるが、それは主にスピードを重視したものであり、コストではありません。
グロスマージンその2: 多くのAIアプリケーションは、高レベルの精度で機能するために「Humans in the loop」に依存しています。
ヒューマン・イン・ザ・ループ・システムには2つの形態があり、そのどちらもが多くのAIスタートアップ企業の粗利を低下させる要因となっています。
1つ目は、今日の最先端のAIモデルのほとんどのトレーニングでは、大規模なデータセットのクリーニングとラベル付けを手作業で行う必要があります。このプロセスは手間がかかり、コストも高く、AIの普及を阻む最大の障壁の一つとなっています。さらに、上で説明したように、モデルが配備されたらトレーニングは終わりではありません。精度を維持するためには、新しいトレーニングデータを継続的に取得し、ラベル付けし、システムにフィードバックする必要があります。ドリフト検出やアクティブラーニングのような技術は負担を軽減することができますが、多くの企業がこのプロセスに最大で収益の10~15%を費やしているという実例データがあります(通常はコア・エンジニアリング・リソースは含まれていません)。
第二に、多くのタスク、特により高度な認知的推論を必要とするタスクでは、人間がリアルタイムでAIシステムに接続されていることが多いです。例えば、ソーシャルメディア企業は、何千人もの人間のレビュアーを採用して、AIベースのモデレーションシステムを強化しています。多くの自律走行車システムには人間の遠隔操作者が含まれており、ほとんどのAIベースの医療機器は、医師との共同意思決定者としてのインターフェースを提供しています。現代のAIシステムの能力がより理解されつつあるため、このアプローチを採用するスタートアップ企業が増えています。純粋なソフトウェア製品の販売を計画していた多くのAI企業が、サービス機能を社内に持ち込んで関連コストを予約するケースも増えています。
AIモデルの性能が向上すれば、人間の介入の必要性は減少する可能性が高くなります。しかし、人間が完全にループから切り離されることは考えにくいでしょう。自動運転車のような多くの問題は、現在の世代のAI技術では完全に自動化するには複雑すぎます。安全性、公平性、信頼性の問題もまた、人間による監視が必要です。これは、米国、EU、その他の国で現在開発中のAI規制に明記される可能性が高い事実です。
AIモデルの性能が向上すれば、人間の介入の必要性は減少する可能性が高くなります。しかし、人間が完全にループから切り離されることは考えにくいでしょう。
クリックしてツイートする
最終的に特定のタスクの完全自動化が実現したとしても、その結果としてどれだけのマージンが改善されるかは明らかではありません。AIアプリケーションの基本的な機能は、入力データの流れを処理し、関連する予測を生成することです。したがって、システムを運用するためのコストは、処理されるデータ量の関数です。いくつかのデータポイントは人間によって処理され(比較的高価)、他のデータポイントはAIモデルによって自動的に処理されます(できれば安価)。しかし、すべての入力はいずれかの方法で処理する必要があります。
そのため、これまで説明してきた2つのカテゴリーのコスト、つまりクラウドコンピューティングと人間によるサポートは、実際にはリンクしています。一方のコストを削減すれば、他方のコストも増加する傾向にあります。どちらも最適化することは可能ですが、SaaSビジネスに関連するコストをゼロに近いレベルにまで下げることはできないでしょう。
AIシステムのスケーリングは、AIがロングテールで生きているため、予想以上に不安定になる可能性があります。
AI企業にとって、Product/Market Fit (PMF) を見極めることは、従来のソフトウェアよりも少し難しいものです。特に5~10社の優良顧客を獲得した後に、MLチームのバックログが膨らみ始め、顧客のデプロイメント・スケジュールが不吉なほどに伸び始め、新規販売からリソースが遠ざかっていくのを目の当たりにするだけで、PMF に到達したと思い込むのは簡単なことです。
多くの場合、原因はエッジケースにあります。多くのAIアプリは、オープンエンドのインターフェースを持ち、ノイズの多い非構造化データ(画像や自然言語など)で動作します。ユーザーは製品に対する直感を欠いていることが多く、さらに悪いことに、製品が人間/超人的な能力を持っていると思い込んでいることもあります。これは、エッジケースが至る所にあることを意味します。私たちが調査したAI製品の意図した機能の40~50%は、ユーザー意図のロングテール部分に存在する可能性があります。
別の言い方をすれば、ユーザーはAIアプリに何でも入力することができます。
ユーザーはAIアプリに何でも入力することができます。
この巨大な状態空間を処理することは、継続的な作業になりがちです。入力可能な値の範囲が非常に広いため、新しい顧客の導入ごとに、これまでに見たことのないデータが生成される可能性があります。例えば、2つの自動車メーカーが欠陥検出を行っているなど、一見似ているように見える顧客であっても、組立ラインにビデオカメラを設置しているなどの単純な理由で、大幅に異なるトレーニングデータが必要になることがあります。
ある創業者は、この現象をAI製品の「タイムコスト」と呼んでいます。彼女の会社では、各新規顧客エンゲージメントの開始時に、データ収集とモデルの微調整のための専用期間を設けています。これにより、顧客データの分布を可視化することができ、展開前のいくつかのエッジケースを排除することができます。モデルの精度が許容できるレベルに達するまで、会社のチームと財務リソースが縛られてしまいます。トレーニングデータをより速く生成するためのオプションは一般的にはほとんどないため、トレーニング期間の長さも一般的には不明です。それはチームがどれだけ努力しても...です。
AIスタートアップは、製品の展開に予想以上に多くの時間とリソースを費やしてしまうことがよくあります。モックアップ、プロトタイプ、ベータテストなどの従来のプロトタイピングツールは、エッジケースではなく、最も一般的なパスのみをカバーする傾向があるため、これらのニーズを事前に特定することは難しい場合があります。従来のソフトウェアと同様に、このプロセスは特に初期の顧客コホートでは時間がかかりますが、従来のソフトウェアとは異なり、時間が経てば消えるというわけではありません。
AIビジネスを守るためのプレイブックは今もなお書かれている
優れたソフトウェア企業は、強力な防御的な壕を中心に構築されています。最良の壕のいくつかは、ネットワーク効果、高いスイッチングコスト、規模の経済性などの強力な力です。
これらの要因はすべて、AI企業にも可能です。 防御力の基盤は通常、特に企業においては、技術的に優れた製品によって形成されます。複雑なソフトウェアを最初に実装することで、大きなブランドの優位性と、ほぼ独占状態に近い期間を得ることができます。
AIの世界では、技術的な差別化を実現するのは難しいものです。新しいモデル・アーキテクチャは、ほとんどがオープンでアカデミックな環境で開発されています。オープンソースのライブラリからリファレンス実装(事前に訓練されたモデル)が利用可能で、モデルのパラメータは自動的に最適化することができます。データはAIシステムの中核をなすものですが、顧客が所有していたり、パブリックドメインであったり、時間の経過とともにコモディティになることが多いです。また、市場が成熟するにつれて価値が低下し、比較的弱いネットワーク効果を示します。いくつかのケースでは、データを供給するAIビジネスに関連した規模の不経済性さえ見てきました。モデルが成熟してくると、「データ競争優位性の空約束」(日本語訳)で論じられているように、新しいエッジケースが増えるごとに、対応するためのコストが高くなる一方で、関連性のある顧客はどんどん少なくなっていきます。
これは、必ずしもAI製品が純粋なソフトウェアに比べて防御力が低いことを意味するものではありません。しかし、AI企業にとっての壕は、多くの人が予想していたよりも浅いようです。AIは防御性の観点から、基礎となる製品やデータへのパススルーが大部分を占めているかもしれません。
これは、必ずしもAI製品が純粋なソフトウェアに比べて防御力が低いことを意味するものではありません。しかし、AI企業にとっての壕は、多くの人が予想していたよりも浅いようです。
クリックしてツイートする
偉大なAI企業の構築、スケーリング、防御 - 創業者のための実践的なアドバイス
私たちは、AI企業が長期的に成功を収めるための鍵は、課題を自らのものにし、サービスとソフトウェアの両方の長所を組み合わせることだと考えています。その意味で、新規または既存のAIアプリケーションで成功するために、創業者が取ることのできるいくつかのステップをご紹介します。
モデルの複雑さを可能な限り排除します。顧客ごとにユニークなモデルをトレーニングするスタートアップと、単一のモデル(またはモデルのセット)をすべての顧客間で共有できるスタートアップとでは、COGSに大きな違いがあることがわかりました。単一モデル戦略は、保守が容易で、新規顧客への展開が迅速で、よりシンプルで効率的なエンジニアリング組織をサポートします。また、データ・パイプラインのスプロールや重複したトレーニングの実行を減らす傾向があり、クラウド・インフラストラクチャのコストを大幅に改善することができます。この理想的な状態に到達するための銀の弾丸はありませんが、取引に合意する前に、顧客とそのデータについて可能な限り多くのことを理解することが1つの鍵となります。新しい顧客が現れたことで、MLエンジニアリングの取り組みに大きな分岐点が生じるのは明らかな場合もあります。ほとんどの場合、その変更はより微妙なもので、いくつかのユニークなモデルや微調整が含まれているだけです。このような判断を下すことは、長期的な経済的健全性と短期的な成長をトレードオフすることであり、AI創業者が直面している最も重要な仕事の一つです。
データの複雑さを軽減するために、問題領域を慎重に、そして多くの場合は狭く選択します。人間の労働を自動化することは根本的に難しいことです。多くの企業は、AIモデルが実行可能な最低限のタスクが予想以上に狭いことに気づいています。例えば、一般的なテキストの提案を提供するのではなく、電子メールや求人情報の中で短い提案を提供することで成功しているチームもあります。CRMの分野で働いている企業は、記録を更新するだけのAIに非常に価値のあるニッチを発見しています。このような問題には、人間が実行するのは難しいものですが、AIにとっては比較的簡単なものもあります。これらの問題は、モデレーション、データ入力/コーディング、転写などの高規模で複雑性の低い作業を伴う傾向があります。これらの分野に焦点を当てることで、永続的なエッジケースの課題を最小限に抑えることができるでしょう。
AI企業が長期的に成功するための鍵は、課題を克服し、サービスとソフトウェアの両方の長所を組み合わせることだと私たちは考えています。
クリックしてツイートする
高額な変動費を想定して計画を立てましょう。創業者であるあなたは、ビジネスモデルの信頼性の高い、直感的なメンタルフレームワークを持っているはずです。このポストで議論されているコストは、良くなる可能性が高い-何らかの定数によって削減される-が、それらが完全に消えると仮定するのは間違いでしょう(あるいは不自然にそれを強要するのは)。その代わりに、より低い粗利益率を念頭に置いたビジネスモデルとGTM戦略を構築することを提案します。創業者からの良いアドバイスをいくつか紹介しましょう。モデルに供給するデータの分布を深く理解します。モデルのメンテナンスと人間のフェイルオーバーを一次的な問題として扱います。本当の変動費を追跡して測定します - 研究開発費に隠さないようにします。財務モデルでは、特に資金調達の際には、保守的なユニットエコノミクスの前提を設定してください。問題を解決するために、規模の拡大や外部の技術の進歩を待たないようにしましょう。
サービスを受け入れましょう。市場が立ち上がっているところには、市場に対応するための大きなチャンスがあります。それは翻訳ソフトウェアよりもむしろフルスタック翻訳サービスを提供することを意味するかもしれませんし、自動運転車を販売するよりもタクシーサービスを運営することを意味するかもしれせん。ハイブリッドビジネスを構築するのは純粋なソフトウェアよりも難しいですが、このアプローチは顧客のニーズを深く洞察し、急成長し、市場を定義する企業を生み出すことができます。サービスはまた、企業の市場投入エンジンをキックスタートさせるための素晴らしいツールにもなります(より詳しくはこちら(日本語訳))。特に複雑なテクノロジや新しいテクノロジを導入するときにはなおさらです。重要なのは、ソフトウェアとサービスの両方の顧客をサポートするのではなく、一つの戦略をコミットした方法で追求することです。
技術スタックの変化を計画します。現代のAIはまだ黎明期にあります。実務者が効率的かつ標準化された方法で仕事をするのに役立つツールは、まだ構築されたばかりです。今後数年の間に、モデルトレーニングの自動化、推論の効率化、開発者のワークフローの標準化、本番環境でのAIモデルの監視と安全性確保のためのツールが広く利用できるようになると予想されます。また、一般的にクラウドコンピューティングは、ソフトウェア企業が取り組むべきコストの問題として注目を集めています。アプリケーションを現在のやり方に緊密に結びつけることは、将来的にはアーキテクチャ上の欠点につながる可能性があります。
昔ながらの方法で防御性を構築します。AIモデル自体、あるいはその基礎となるデータが長期的な壕を提供するかどうかは明らかではありませんが、優れた製品と独自のデータは、ほとんどの場合、優れたビジネスを構築することになります。AIは、創業者に古い問題に新しい視点を与えてくれます。例えば、AI技術は、比較的眠っていたマルウェア検出市場において、より優れたパフォーマンスを示すだけで、新たな価値を提供してきました。初期のユニークな製品能力の上に、スティックする製品や永続的なビジネスを構築する機会は永遠に続きます。興味深いことに、最近のオープンソース企業と同様に、効果的なクラウド戦略によって市場での地位を固めているAI企業もいくつか見られます。
* * *
要約すると、今日のほとんどのAIシステムは、伝統的な意味でのソフトウェアではありません。そしてAIビジネスは結果として、ソフトウェアビジネスのようには見えません。継続的な人的サポートと材料の変動コストが発生します。それに、私たちが望むほど簡単には拡張できないことが多いです。また「一度構築して何度も販売する」というソフトウェア・モデルに不可欠な強力な防御力は、無料では提供されないようです。
これらの特徴は、AIをある程度、サービスビジネスのように感じさせます。別の言い方をすればこうなります。サービス会社を取り替えることはできるが、サービスを(完全に)取り替えることはできません。
信じられないかもしれませんが、これは良いニュースかもしれないのです。変動費、スケーリング・ダイナミクス、防御のための壕のようなものは、最終的には個々の企業ではなく、市場によって決定されます。データに見慣れないパターンが見られるという事実は、AI企業が本当に新しいものであることを示唆しています。アイデアの迷路をうまくナビゲートし、一貫して強力なパフォーマンスを発揮する製品を構築している偉大なAI企業は、すでに数多く存在しています。
変動コスト、スケーリングダイナミクス、防御の堀などは、最終的には市場によって決定されるものであり、個々の企業ではありません。データに見慣れないパターンが見られるという事実は、AI企業が本当に新しいものであることを示唆しています。
クリックしてツイートする
AIは、研究テーマから生産技術への移行はまだ早いです。現在のAIソフトウェア開発の波を蹴散らしたAlexNetが発表されてから8年も経っていないことを忘れがちです。インテリジェントなアプリケーションがソフトウェア業界を前進させているのです。
出典:従来型ソフトウェアの粗利益率はpubliccomps.comに掲載されている企業の中から選択したものです。従来型ソフトウェアの売上総利益率はpubliccomps.comに掲載されている企業の中から選択したもの、サービス企業の売上総利益率は10Kのファイリングに基づいたもの、AIビジネスの売上総利益率はAIスタートアップ企業の創業者へのインタビューに基づいたものです。
著者紹介 (本記事投稿時の情報)
Martin Casado は Andreessen Horowitz のジェネラルパートナーです。彼は以前、2012年に VMWare に買収された Nicira の共同創業者で CTO でした。VMWare で、Martin はNetworking and Secruity Business のVPならびにGMでした。
Matt Bornstein は Andreessen Horowitz のエンタープライズディールチームのパートナーです。現在の人工知能の波を支える新しいデータシステムとテクノロジーに焦点を当てています。彼は、AI/MLの新しいアプリケーションを発見し、創業者がこの新しいクラスの製品がもたらすビジネス上の課題を解決するのを支援することを使命としています。
a16zに入社する前、Matt はシードステージのベンチャーキャピタルであるBlumberg Capitalのメンバーとして、Pachyderm、SigOpt、SmithRxなどの企業への投資を率いていました。また、LinkedInのBizOpsチームで働き、Monitor Groupで経営コンサルタントを務め、2つのスタートアップをブートストラップで共同設立しました。
Mattはハーバード・ビジネス・スクールでMBAを、ブラウン大学で数学の理学士号を取得しています。
記事情報
この記事は原著者の許可を得て翻訳・公開するものです。
原文: The New Business of AI (and How It’s Different From Traditional Software) (2020)