GoogleのAIエージェント:未来のAI技術と革新の展望
By Wes Roth · 2024-04-11
GoogleはAIエージェントに注力しており、Google Cloud Next KeynoteプレゼンテーションではAIエージェントの未来が紹介されました。AI技術の革新やAIエージェントの展望について解説します。
GoogleのAIエージェント:未来の新機能と革新の展望
- GoogleはAIエージェントに全力投球しているようです。最新のGoogle Cloud Next Keynoteプレゼンテーションでは、AIエージェントが一大テーマとなっており、顧客サービス用のAIエージェント、従業員の業務効率向上のためのAIエージェント、マーケティング用のAIエージェント、運転用のAIエージェント、膨大なデータの分析用のAIエージェント、コンテンツやポッドキャスト、ビデオの作成用のAIエージェント、サイバーセキュリティ用のAIエージェント、コーディング用のAIエージェント、新しいeコマースページの展開用のAIエージェントなど、ありとあらゆる分野でAIエージェントが展開される予定です。
- 本稿では、Googleが展開予定の重要な発表とAIエージェントのデモを抜粋して解説しています。我々の今日の最大の発表は生成的AIに焦点 を当てています。お客様は、生成的AIを実験から進化させ、質問に答えたりAI予測を行ったりするだけでなく、生成的AIエージェントを構築しています。エージェントは複数のモーダル情報を同時に処理し、会話をし、推論を行い、学習をし、意思決定を行います。エージェントは他のエージェントや人間と連携し、各々のコンピューティングデバイスやウェブとのインタラクションを変革するでしょう。
- 弊社の顧客はAIエージェントの初期バージョンを構築しています。先進的な推論スキルを備えた基本モデルGeminiを導入しています。幅広く使用されている第一者、第三者、オープンソースモデルを提供する唯一のクラウドであるGoogleは、Vertex AIを利用してカスタムモデルにアクセスし、調整し、拡張し、展開し、エージェントを構築しています。また、人前で最新のモデルGemini 1.5 Proを展開しました。GoogleはAI分野で相当苦労していたようですが、この1.5 Proモデルでかなりの進展を遂げたと思います。混合専門家アーキテクチャを採用しており、GPT-4とは異なるモデルです。Googleはこの技術を取り戻し、モデルを進化させています。
- Gemini 1.5 Proの重要なポイントは、100万トークンのコンテキストウィンドウを搭載しています。過去に彼らの他の製品を試して物足りなさを感じたことがある場合は、彼らがしているいくつかの主張に懐疑的な姿勢を取るかもしれませんが、Gemini 1.5 Proの進化は注目に値します。
GoogleのAIエージェント:未来の新機能と革新の展望
次世代AIテクノロジー:顧客代理人の革新的な力
- 次世代のAIテクノロジーがますます進化する中、Googleからの重要な発表が続々と行われています。Geminiモデルを活用したGoogleの革新的な取り組みは、会話の自然さや人間らしさを追求し、テキスト、音声、画像、動画など多様な入力形式を活用しています。
- Gemini Proを用いて会話の流れを自由に作り上げることで、人間らしい会話を実現することができます。さらに、カスタム音声モデルを活用して会話をパーソナライズすることも可能です。自然言語の指示を使用して会話の流れを制御し、特定のトピックを排除したり、必要に応じて人間の代理店に引き継ぐことができます。
- 企業の空間におけるAI製品への注力はますます高まっており、Googleはこれらの大規模なグローバル企業にAI製品を提供し、全従業員が活用することを目指しています。Geminiやベクトル検索を駆使した顧客代理人の導入により、シームレスなショッピング体験など、様々な可能性が広がっています。
- これまで以上に革新的なAIテクノロジーを活用して、顧客代理人の機能や効果を最大限に引き出すことが重要です。Geminiモデルの活用やベクトルベースの検索、キーワード検索を通じて、内部情報やウェブ全体にアクセスすることで、顧客に迅速かつ正確なサポートを提供することが可能です。
- テクノロジーの進化は加速しており、企業や組織がAIテクノロジーの活用を進める過程で、より効果的な顧客代理人を構築する手段が提供されています。Googleの取り組みや革新的なアプローチにより、今後さらなる進化が期待されています。
次世代AIテクノロジー:顧客代理人の革新的な力
AIが革新するカスタマーサービス体験
- 最近のテクノロジーの進化により、カスタマーサービスの体験は大きく変化しています。例えば、GeminiのAIはテキストとビデオを分析し、顧客の要望を正確に特定し、検索可能な形式に変換します。
- GeminiのAIは迅速に私が求めているチェック柄のシャツを見つけ、他にもいくつかの素敵なオプションも提示してくれます。しかし、サイズが残りわずかという事実に 少し焦りを感じます。
- このシャツを手に入れ損ねたくない私はすぐに店舗に電話し、取り置きしてもらうことに決めます。コンサートでこのシャツを着ているのが目に浮かびます。
- Symbol Fashionのカスタマーエージェントからのサポートも素晴らしく、オンラインでのショッピングがさらにスムーズになります。AIアシスタントによるカスタマーサービスは、私たちのビジネスにも大きな可能性を秘めていると感じます。
- 今後の展望としては、AIアシスタントを活用したカスタマーサービスがどのように実装されるかが注目されます。悪用される可能性もありますが、バランスを保つ仕組みが整備されれば、より良いオンライン体験が提供されることを期待します。
AIが革新するカスタマーサービス体験
AIアシスタント:未来の生産性向上の鍵
- 新しい時代において、AI(人工知能)アシスタントは私たちの生活や仕事のあり方を革新的に変えています。従業員だけでなく個人としても、生産性を向上させる手助けとなります 。
- 例えば、車やアパートをリースしようとする際に法的契約書を調査する必要があったり、米国において医療費の請求に混乱することがあります。医療請求業界は非常に複雑で、私たちが理解しにくい点が多くあります。
- このような困難な作業にAIアシスタントが介入すれば、大きな助けとなることでしょう。Gemini for Workspaceが提供するサービスは、顧客が時間を節約できる多くの方法があります。例えば、新しい給与システムの提案書を評価する際に、Geminiがプロポーザルの概要を瞬時に提供してくれます。
- Gemini for Workspaceは、Google Driveとも連携し、ファイルを簡単にドラッグ&ドロップしてプロポーザルの概要を取得できる画期的なAIアシスタントです。長大なファイルを分析する手間を省き、時間を大幅に節約することが可能となります。
- Geminiが提供するサマリー機能は、ファイルの要点を把握するのに役立ちます。加えて、コンプライアンスの確認もGeminiに任せれば、効率的に作業を進められます。ルールブックの100ページを手作業で確認する必要はありません。Geminiが機敏に対応し、効率的に業務をサポートします。
- Gemini for Workspaceを活用することで、ビジネス上の決定を容易にするだけでなく、コンプライアンスの確認やセキュリティの 保護にも役立ちます。AIアシスタントの力を借りて、生産性を向上させる未来がやってきました。
AIアシスタント:未来の生産性向上の鍵
未来の職場を変える革新的なAIテクノロジー
- 革新的なAIテクノロジーが今回の事例で素晴らしかったです。精度を損なうことなく、多くの時間を節約できました。このテクノロジーは多くの他の用途にも応用できるんです。
- 営業チームがRFPを分析する際、リクルーターが面接の質問を開発する際など、さまざまなケースに適用できます。
- 私たちの多くの顧客は、退屈で繰り返しの作業を自動化するために従業員エージェントを構築しています。
- 全米有数の医療機関であるHCA Healthcareは、私たちの生成AIテクノロジーを活用して、介護者が患者との時間を増やし、ペーパーワークに費やす時間を減らすのに役立てています。
- 彼らはKatieをテストしています。Katieは看護師の連携のデジタルアシスタントであり、1 人の介護者のシフトが終了し、別の介護者のシフトが始まる際に連続性を確保するのに役立ちます。
- このAIテクノロジーは、私のGoogle Chatに直接統合されているため、すべての情報を整理する際にコンテキストを切り替える必要がありません。
- Gemini ModelsとVertex AIを使用して開発された従業員エージェントは、私のメールと動画の要約を効率的に行います。
- 私はすでに歯科と視力の計画を終えていますが、最も重要な医療計画にはまだ手をつけていません。既存のカバレッジとこのオプションを比較してみましょう。
未来の職場を変える革新的なAIテクノロジー
未来を変える革新的テクノロジー:Googleの新展開
- Geminiモデルの長いコンテキストウィンドウとVertex拡張機能を組み合わせることで、エージェントはPDFなどの非構造化データを含むさまざまなソースから大量のデータをクロスリファレンスすることができます。
- Geminiの高度な推論能力を活用して、エージェントは私の現行プランの複雑な詳細を理解し、2025年の新しいオプションと比較することができます。
- 企業のグラウンディング機能により、Geminiが結論を導く際に使用された正確なデータにリンクされているため、こちらでリンクされているように、金製のプランが最適であるという推奨を自信を持って信頼することができます。
- さて、そろそろ…。正式に入会手続きを完了しましたので、今年は娘が歯列矯正が必要になります。エージェントを使用して、適切な矯正医を見つけるのを手伝ってください。
- 娘は今年、矯正が必要になります。自宅の近くにベストな提携矯正医を見つけるのを手伝ってください。
- Vertex拡張機能を使用すると、Geminiモデルは外部または内部の任意のAPIと統合することができます。これにより、エージェントはリアルタイムのGoogleマップやPlacesデータと直接に私の歯科保険の詳細を結びつけて、私の近くにあるベストランクの提携プロバイダを決定するのに役立ちます。
- でも、Symbol Orthodonticsは土曜日に予約を受け付けている唯一の矯正医ですね。これは私の家族のスケジュールに最適ですが、彼らについて実際に何を知っているのでしょうか?エージェントが本当に最適な矯正医を選んだかどうかを どうやって知ればいいでしょう?
- また、サマリーのスキャンで、彼らが子供たちと仕事をするのが得意であることが分かりました。特にこの顧客レビューが気に入りました。それでいいですね、コールをスケジュールしましょう。ただ、スケジュールをどうやって見つけるのでしょう?
- エージェントは、Googleカレンダーと連携しているため、Google Cloud Nextにいることを把握しています。そのため、コールをスケジュールする時間を見つけることができます。
- 素晴らしい、コールの予定が取れましたね。他に必要なものはありますか?いいえ、大丈夫ですね。完璧です、簡単で嬉しいですね。従業員エージェントがどのようにお手伝いできるか想像してみてください。全体的に、私はかなり興奮しています。
未来を変える革新的テクノロジー:Googleの新展開
創造性を引き出すAI動画作成アプリ:GeminiとBids
- GeminiとBidsを使えば、ビデオライティング、制作、編集アシスタントがすべて1つになります。GeminiとBidsを 使って、どれだけ簡単に始められるかをご紹介しましょう。
- 私がNextで一週間過ごした後、組織と興奮を共有するためにリキャップビデオを共有したいと思います。Bidsを開くと、Geminiがスタートを切るのを手伝ってくれます。既存のドキュメントをコンテキストとして使用して、プロンプトを入力するだけです。そのプロンプトに基づいて、Geminiが物語のアウトラインを提案してくれます。これは簡単にカスタマイズして編集できます。感情豊かなスタイルを選択し、Bidsがその魔法をかけます。では、結果を見てみましょう。
- 驚くべきことに、美しくデザインされた完全アニメーションのシーンを含む、関連するストックメディアや音楽、さらには生成された台本が付いた最初のドラフトが手に入ります。今週キャプチャした楽しいビデオや写真を直接GoogleドライブやGoogleフォトにアクセスして追加することができます。ビデオの専門知識がなくても、スライド作成と同じくらい簡単にシーンを構築できます。しかし、そこで止める必要はありません。Bidsでは、自分の方法でストーリーを個人的にカスタマイズできます。Geminiの事前設定ボイスを使用するか、自分で録音するか選択できます。
- Bids以外にも、多くの顧客がマーケティングチーム、オーディオ・ビデオ制作チーム、そして手助けが必要な全てのクリエイティブな人々のためにエージェントを構築しています。我々は、クリエイティブエージェントを構築するための非常にパワフルなプラットフォームとスタックを提供しています。まず、最高の画像生成モデルを使用します。Imagine 2.0は、テキストから画像に変換する最も先進的な技術で、ビジネスが特定のブランド要件に合う画像を作成するのに役立ちます。これは現在、Vertex AIで一般提供されています。
- Imagineの一環として、本日プレビューでテキストからライブ画像への変換を導入しています。マーケティングやクリエイティブチームは、テキストプロンプトからアニメーション画像を生成することができます。製品画像、広告、GIF、ストーリーボードなどを含みます。
- また、Imagineによって生成されたAI画像用のデジタル透かしの一般提供を誇らしく思います。これはGoogle DeepMindの技術を駆使しています。
創造性を引き出すAI動画作成アプリ:GeminiとBids
未来の画像編集:Imagine 2.0の革新的な編集モード
- Imagine 2.0の新しい編集モードがついに発表されました。これにより、画像から不要な要素を簡単に削除したり、新しい要素を追加したり、画像の境界を拡張して より広い視野を作成することが容易になります。
- Imagine 2.0のAPIとGoogle Workspaceと共に開発した創造的エージェントがどのように役立つかを見てみましょう。まずは、ブランドの外観と雰囲気を見て、感じ取りましょう。ブランドの主要なスタイルとテーマは何でしょうか?
- 創造的エージェントは、以前のキャンペーンを分析して独自のブランドスタイルを理解し、新しいアイデアに適用します。 手始めに、創造的エージェントは、Googleドライブ内に含まれる当社のカタログの他の製品の3,000以上のブランド画像、説明、動画、文書を分析してこのサマリーを作成しました。そして、ボールト、冒険的、目標を掲げたというわけです。
- 次に、Imagineを使用して、アイコニックで現実的なアウトドアシーンでテントを素晴らしい新しい画像を動的に生成するよう創造的エージェントを促します。本物のランドマークを正確に提示しています。
- そして、メッセージをしっかり伝えるための物語を作成しましょう。創造的エージェントはGemini Proの多様な能力を活用して、各写真にマッチする創造的なキャプションのアイデアを考案しました。 これも素晴らしい。
- 新しいキャンパー向けのコンテンツ、Symbol Outfittersのポッドキャスト向けのコンテンツ、そしてソーシャルメディア向けのより視覚的にダイナミックなものの3つのリクエストがあります。
- まず、新しい興味津々なキャンパー向けのストーリーボードを作成しましょう。リラックスしたキャンピングの参加者向けに新しい画像、新しいキャプション、新しいストーリーボードをリクエストしています。
- これは非常にリラックスした雰囲気を醸し出しており、ストーリーボードも見事です。このように、創造的エージェントは新しい視聴者向けにアイデアを調整しました。コンテキストを理解し、求められた変更を行いました。
- 次に、ポッドキャストを作成しましょう。Geminiモデルの複雑な推論により、1回のプロンプトでスクリプトとオーディオクリップを生成することができます。
- SSML(音声合成マークアップ言語)でポッドキャストのスクリプトを作成し、その出力をテキストtoスピーチAPIに渡すことをお願いしています。結果は、2人の人がテントについて話すエピソードです。