なぜ音声コンピュータはいつも失敗するのか?
By TechAltar · 2024-02-23
音声コンピュータはいつも期待されるほどの成果を上げてきませんでした。MicrosoftのCortanaやAmazonのAlexaなど、大手テック企業も成功を収められなかった例が少なくありません。この記事では、なぜ音声コンピュータが失敗し続けるのかについて探っていきます。
音声コンピューティングの新たな展望
- MicrosoftのCortanaは失敗し、同社は完全にシャットダウンした。
- AmazonのAlexaビジネスも1年に10億ドルもの損失を出す大失敗で、テックの巨人でさえAirbnbの収益を上回るほどの赤字だった。
- Googleは少しマシだが、Googleアシスタントに関連する新しいデバイスがほとんど登場していない。
- AppleのSiriも更新が少なく、12年後にも重要なアップデートがほとんどない。
- これまでの音声アシスタントは徐々に改善されてきたが、大きな失望を招いた。テック大手は12年間も音声コンピューティングプラットフォームで利益を得る方法や、消費者に複雑なタスクを行わせる方法を見つけられていない。
- しかし、SF映画を見る限り、コンピュータと会話することが将来の重要な部分になると多くの人が考えている。新たな声ベースコンピュータの波が現れ、これらはついに期待に応え、声と自然言語を将来のインターフェースにすると主張している。
音声コンピューティングの新たな展望
ボイスAIの将来性についての誤った主張
- ボイスAIによるユーザーインターフェースの進化について大いに期待されており、特に視力の悪い人や高齢者にとって画期的な進歩となる可能性がある。
- 一方で、ユーメイン社が行っているフレーミングは現実とはかけ離れたものである。同社は、ボイスAIを利用したAIピンがスマートフォンの実質的な代替品であり、次世代の一般的なコンピューティングインターフェースになると主張している。
- しかし、AIピンのセットアップには実際の画面と正確な入力操作が 必要であり、音声や非常に基本的なプロジェクターだけでそれらを行うことは不可能であり、プライバシー上の懸念も存在する。
- ボイスAIは端末との素早いやり取りにおいては有用であるが、次世代の一般的なコンピューティングの主要なインターフェースとしては非現実的であり、このような主張は誤りであるとされている。
ボイスAIの将来性についての誤った主張
音声操作デバイスの制限
- AI製品を含むカメラのリモート操作アプリや、ソーシャルメディアアプリ、動画ストリーミングアプリなど、視覚に依存するアプリは音声での操作が基本的に不可能。
- 銀行やファイナンス関連の取引やインボイスのレビュー、表計算の編集、PDFファイルのスキャンなども音声操作には適さず、精密な入力が求められる。
- 地図アプリは基本的な案内はできるものの、高解像度の画面を見ながら物事を視覚化することは音声操作では困難。
- ショッピングでは 商品リストの閲覧や商品の比較、価格履歴の確認、レビューの閲覧、配送オプションのチェックなど、音声での操作が困難。
- コミュニケーションも、長文のメールや複数の添付ファイルを処理する場合、複数のメッセージングアプリを管理する場合、ビデオ通話を行う場合など、音声操作には適さず、簡潔なテキストメッセージ以外は意味をなさない。
- 音楽やポッドキャストの再生、スマートホームデバイスの操作などは、音声操作に適したカテゴリと言える。
音声操作デバイスの制限
音声アシスタントの利点と問題点
- 音声アシスタントは、現在はかなり使いやすいですが、複雑なタスクを音声で行うことは望ましくないことが多いです。
- 音声アシスタントの最大の問題点の1つは、公共の場では使いにくいという点です。また、プライバシーの問題も存在します。
- 音声アシスタントは、情報の提供が非常に遅く、スキップすることができないため、コンピューターの画面に比べて効率が悪いという点もあります。
- また、音声入力は文章を正確に表現するのに向いていないため、コンピューターでの利用には適さない場面が多いです。
音声アシスタントの利点と問題点
Hol lensのデモ
- Hol lensのデモでは、音声によってほとんど完全に制御され、Co-pilot AIを使用して周りの物体を分析します。
- 例えば、作業者が両手を使う必要があるメンテナンスシナリオ中に、周りの物体を見るために使用されます。
- これはスマートフォンの代替ではなく、新しい追加機能です。
- 第二の解決策としては、例えばHumane AI Pinの音声機能は実際には素晴らしいものですが、上に優れたスクリーンと正確な入力方法を追加することで、新しいスマートフォンとして再考することもあります。
- しかし、この時点で実質的にはスマートフォンを再発明しているだけで あり、GPDアプリを使用してほとんど全てのことができるスマートフォンに等しいと言えます。
- スマートフォンではHumane AIと同様に音声を使用することができ、任意の入力方法を使用することもできます。
- 声によるAIは再び合理的ですが、スマートフォンを置き換えるという考えは愚かなアイデアだと思います。
- Humane AI Pinを購入するよりも、iFixitの修理キットを購入することをお勧めします。
- iFixitの修理キットは、自分の持っているデバイスを修理するためのものであり、新しいものを購入する代わりに自分自身への完璧な贈り物です。
- 彼らは実際の部品も販売しており、100,000以上の無料マニュアルと修理ガイドを提供しています。
- iFixitはデバイスを自分で修理できるよう支援する素晴らしい会社であり、長年にわたり修理の権利を守ってきたとても高品質な製品を提供しています。
Hol lensのデモ
Conclusion:
音声コンピュータは現在のところ、特定のタスクにおいて有用である一方で、多くの制限や問題が存在します。テック企業が将来のインターフェースとしての可能性を追求する中で、私たちはさらなる進化に期待することができます。しかし、音声コンピュータが従来のコンピューティングを完全に置き換えることは容易ではないことが明らかになりました。