VC が音声を AI イノベーションの次の大きなフロンティアとみなす理由

  • PitchBook のデータによると、音声 AI スタートアップ企業は 2024 年に VC 資金で 3 億 9,800 万ドル以上を調達しました。
  • このテクノロジーは、顧客サービスやアシスタントなどの企業用途に拡大しています。
  • BI は、初期の音声 AI 分野における未開発の機会について投資家に語りました。

音声は急速に新しい AI の戦場になりつつあります。

話題の仮想アシスタントから音声合成ツールに至るまで、このテクノロジーはこの 1 年で急速に普及しました。

AI 音声テクノロジーは新しいものではありませんが、ツールは急速に洗練されており、コールセンターから人材紹介会社まで導入が促進されています。

その使用例は、リアルタイムの音声文字起こしからテキスト プロンプトからの合成音声の生成まで、多岐にわたります。

競争の激しいAI市場で次の機会を求めている投資家は、スタートアップに小切手帳を投げ捨てている。によると ピッチブックデータ、音声AIテクノロジーを開発するスタートアップは、2024年にVC資金で3億9,800万ドル以上を調達しました。

ロンドンに本拠を置き、コールセンター向けの音声アシスタントを開発しているPolyAIは、Hedosophiaからの資金調達ラウンドで5,000万ドルを確保した。ロンドンとニューヨークに本社を置き、音声クローン技術を開発したイレブンラボは、2024年1月に1億ドルを調達し、さらに2億ドルを調達すると言われているとBusiness Insiderが最初に報じた。

「リアルタイム音声読み上げ処理における最近の進歩により、仮想アシスタント、顧客サポート、音声ベースの生産性などの新たなユースケースが可能になりました」とVC企業Baldertonの投資家Sivesh Sukumar氏は述べた。 「イレブンラボやオープンAIのような企業はこの分野の最前線にあり、イレブンラボはリアルタイムAPIをリリースしており、さらなる採用を促進すると予想されています。」

音声 AI は比較的初期の分野であるため、確立された既存の企業はまだありませんが、この分野における未開発の機会に対する投資家の興奮を引き起こしているとスクマール氏は付け加えました。

拡大するエコシステム

スタートアップ企業は、企業や消費者のさまざまなニーズに合わせて音声テクノロジーを調整する方法を迅速に特定しています。また、エージェント AI は CEO にとってホットな話題となっており、音声テクノロジーとの重複には大きな可能性が秘められています。

PlayAI は、テキスト読み上げモデルと AI 音声エージェントのための AI プラットフォームを開発しているスタートアップです。 2100万ドルを集めた 11月にシード資金調達。

PlayAI の共同創設者であるハマド・サイード氏は、「人間が別の人間であるかのように会話できる音声エージェントの構築への関心が大幅に高まっているのを目の当たりにしました」と述べた。 「音声AIは主流になりつつあり、人々がテクノロジーと対話する方法における重要なインターフェースとなるだろう。投資家は間違いなくこの機会を認識している」と同氏は付け加えた。

PlayAIも支援しているKindred Venturesの創設者兼マネージングパートナーであるSteve Jang氏によると、次の大きな賭けに向けてエコシステムを精査しているVCは現在、音声AIを技術スタックとして検討しているという。同社の投資方針は、「消費者、エンタープライズ、クリエイティビティにおける多くのユースケースを備えた複数のレイヤー」でスタートアップを支援することだ。

「第一に、専門化された基礎的なモデルがあります。第二に、これらのモデルへのアクセスと統合を提供するインフラストラクチャ サービスとツールがあります。そして、おそらく最も重要なことは、広大な垂直アプリケーション空間があることです」と同氏は BI に語った。

音声は収益化が容易な分野であるため、この分野は投資家にとっても魅力的です。ベンチャーキャピタル会社ヘッドラインのゼネラルパートナー、ジョナサン・ウセロヴィチ氏は「結果によって価格を決めることができるので、収益化は非常に簡単だ」と語る。 「それが、これほど多くの収益を牽引する理由です。特に、その労働を行っている人間の代わりに利用する場合、投資収益率を得るのは非常に簡単です。」

音声 AI に対する消費者の欲求も急増しています。ポッドキャストなどのオーディオ形式を通じて情報を取得することを好むユーザーが増えているため、スクマール氏は、音声コントロールやオーディオ インターフェイスに対する消費者の需要が高まっていることを強調しました。彼は建てた 説得は、ユーザーが就職面接から初デートに至るまで、現実世界での会話を練習できる音声 AI プラットフォームです。なぜなら、そのような消費者のニーズに音声が応える余地があると彼は考えたからです。

「OpenAIが消費者の音声エージェントを捕捉できれば、それらはSiriが想定していたものになるだろう」と同氏は語った。 「個人のデバイスとのインターフェースがさらに増えると思います。その面での電子商取引の消費者エクスペリエンスはさらに向上するでしょう。」

フロンティアラボが追いつきつつある

人気が高まっているにもかかわらず、音声 AI にはまだ確立された強力な存在が存在していないようです。エア・ストリート・キャピタルの調査によると、その理由の一部は、おそらく音声生成機能の悪用が潜在的な反発を引き起こす可能性があるという懸念のため、フロンティア・ラボがこの分野からほとんど遠ざかっていることである可能性がある。 2024 年の AI の現状レポート

エア・ストリート・キャピタルの創設者兼ジェネラル・パートナーのネイサン・ベナイッチ氏は、「膨大な量のオーディオおよびビデオデータを収集しているにもかかわらず、フロンティアラボはテキスト読み上げ製品のリリースが遅れている」と述べた。同氏は、繰り返し延期されてきたOpenAIのAdvanced Voice Modeと、「比較的ロックダウンされている」GoogleのNotebookLMを指摘した。

AI の専門家たちは、世界的な選挙があった年にディープフェイクが増加する可能性があると警鐘を鳴らしていましたが、結果的にはそうではありませんでした。

「おそらく、研究機関は、大きな選挙にしばしば伴うディープフェイクに関するパニックに巻き込まれることを避けたがっていた。潜在的な商業的チャンスが非常に大きいという理由だけで、この分野でさらに活動するのは避けられないと思う」とベナイッチ氏は語った。

ビッグテックはもしかしたら ゆっくりと回転する トレンドに向けて。 Alexaを通じた音声アシスタントの提供を強化するというAmazonの計画は2025年まで延期され、Appleは最近ChatGPT機能を追加してSiri機能を強化した。

それでもベナイッチ氏は、一企業が栄冠を手にするのは簡単なことではない、と指摘した。同氏は、「すでに広く導入され、何年も企業ユーザー向けにツールを最適化してきたイレブンラボのような企業に取って代わるのは困難になる可能性がある」と述べた。