GeminiとAI:未来の技術革新を知る
By Google · 2024-06-08
Google I/O '24で発表されたGeminiとAIの革新的な進化についてご紹介します。GeminiはAI技術の未来を切り拓きます。
Google Gemini: AIの新たな未来を切り拓く革命
- Googleは現在、完全にGemini時代に突入しています。Gemini 1.5 Proが利用可能となり、20億人のユーザープロダクト全てがGeminiを利用しています。
- 今日は、Google Workspaceのラボで、Geminiがどのように生かされているかをご紹介しましょう。人々は常にメールを検索していますし、Gmailでもその強化が進められています。
- Geminiを使えば、最近のメールをまとめて要約するよう依頼することができます。今週旅行中でPTAのミーティングに出席できなかった場合、Google Meetで録音された会議が1時間ものだとします。そのハイライトをGeminiに要約してもらえます。
- 人々は、Geminiを使って生活全般を検索するのが大好きです。Geminiを使えば、写真を使った検索が格段に簡単になり、思い出をより深く探ることも可能です 。
- 例えば、娘のルシアの成長記録に思いをはせていたとしましょう。Geminiに「写真、ルシアの泳ぎの進歩を教えて」と依頼することで、写真で異なる文脈を認識し、すべてをまとめた要約を提供してくれます。
- Geminiをマルチモーダルに構築しているため、さまざまな形式での知識を解き放つことができます。Gemini 1.5 Proを発展させ、過去数ヶ月でコンテキストの拡張やプレビューを行ってきました。それにより、2百万トークンまでのコンテキストウィンドウを拡張しています。
- Geminiは、マルチモーダリティと長いコンテキストによる2つの技術的進歩に焦点を当てています。これらはそれぞれ単独でも強力ですが、一緒になることでより深い機能とより高度な知能が開かれるのです。
- さらに一歩踏み込んで考えてみましょう。AIエージェントによる新たな可能性が見えてきます。これらは、推論、計画、記憶を示す知的システムであり、あなたの代わりに複数のステップを進める能力があります。そして何よりも、あなたの監視下でそれを行います。
- 今日、AIアシスタンスの未来についての新しい進歩を共有する興奮を感じています。それが、私たちが『AIアシスト』と呼んでいるものです。
Google Gemini: AIの新たな未来を切り拓く革命
革新と未来を切り拓くプロジェクトAstraの魅力
- プロジェクトAstraは、長い間普段の生活で本当に役立つ汎用AIエージェントを開発したいと考えてきました。
- ここでは、私たちのプロトタイプのビデオをご覧いただけます。このプロトタイプは2つの部分に分かれており、それぞれがリアルタイムで単発でキャプチャされました。
- このコードは暗号化と復号化の機能を定義しています。鍵と初期化ベクトルIVに基づいてデータをエンコードおよびデコードするためにaes暗号化を使用しているようです。
- Gemini 1.5の新機能は、フラッシュです。プロに比べて軽量なモデルで、スケールできるように高速でコスト効率の良い設計となっています。複数のモーダルリーズニング機能や画期的な長いコンテキストも備えています。
- 今日最も注目すべき進歩の1つは、私たちのチームが達成したジェネレーティブビデオの分野です。新しい、最も能力の高いジェネレーティブビデオモデル「Vo」の発表に、私たちは興奮しています。
- トリリウムは、世界クラスの技術インフラに投資してきた25年間の成果です。今日、前世代のチップに比して1チップあたりの計算性能が4.7倍向上した第6世代のTPU「トリリウム」を発表することに興奮しています。
- Googleの検索は、人間の好奇心のスケールでのジェネレーティブAIであり、それは私たちの最もエキサイティングな検索の1章です。今日ご覧いただくすべての進歩は、Google検索用にカスタマイズされた新しいジェミニモデルによって可能になっています。
- ジェミニ時代の検索は、これまでとは異なる3つのユニークな強みが際立っています。年末までに、AI概要が10億人以上に提供される予定です。AI概要は、最も複雑な質問にもさらに役立つようになります。
革新と未来を切り拓くプロジェクトAstraの魅力
Gemini: 未来のAI技術がもたらす革新的な経験
- Geminiは、10個の質問が1つにまとまったような独自のAI概要を提供することができます。全体の質問とそのサブ質問をまとめてAI概要を得ることができるのです。驚くべき新機能が近日中にリリースされ、動画形式で質問することが可能になります。
- Geminiは、ビデオを使って質問する機能を提供し、ほんの数秒でほぼ即座にGoogleがAI概要を提供してくれます。この機能が確実に作動しない理由やトラブルシューティングの手順について、考えられる理由や対処法を共有します。
- Geminiチームは昨年の5月から、世界中のビジネスや消費者向けに、より多くの支援機能を持つGemini for Workspaceを開発してきました。今では、モバイルカードで質問をタイプし、例えば「屋根修理の見積もりを価格と入手可能性で比較して」といった要求をするだけで、すぐにQ&A機能で回答を受け取れます。
- Geminiが提供する最も知的なAI体験を展開する方法を紹介します。新機能を導入し、ユーザー自身のニーズに合わせてカスタマイズし、任意のトピックのパーソナルエキスパートを作成できる機能を提供します。私たちはこれらを「ジェム」と呼んでいます。
- Gemini Advanceのサブスクライバーは、1,500ページまでのPDFファイルや複数ファイルをアップロードしてプロジェクト全体で洞察を得ることができます。これは世界中でも最長のコンテキストウィンドウを持つGemini 1.5 Proへのアクセス権が得られます。
- Gemini Advancedの新しい旅行計画体験は、次のバケーションのアイデアを提供するだけでなく、スペース、時間ロジスティクス、優先順位付けなどを考慮した合理的な計画が必要です。この理性と知性は、Gemini Advancedの新しい旅行計画体験で一体となります。
- Geminiは、AIをコアにしたAndroidを再構想するために、複数年にわたる旅に乗り出しました。Geminiをコンテキスト感知型にすることで、ユーザーが行おうとしているアクションを予測し、より助けになる機能を提供するようになりました。
Gemini: 未来のAI技術がもたらす革新的な経験
未来への可能性:GeminiとAIの革新的な進化
- Geminiという革新的な技術は、私たちの生活に革新的な進化をもたらしています。例えば、Gemini Nanoを使用することで、私たちのスマートフォンが私たちの理解力を持ち、テキスト入力だけでなく、視覚、音声、言語を通じて世界を理解することが可能になります。
- また、Geminaファミリーには、AIの革新と責任を担うために不可欠なオープンモデルが含まれています。その中でも、最新のメンバーであるPoly Gemmaは、ビジョン言語のオープンモデルとして利用でき、今すぐ利用可能です。
- さらに、Gemina 2の登場も待ち遠しいです。Geminaの次世代モデルであるGemina 2は、6月に利用可能になります。数週間後には、新たに270億のパラメーターモデルがGemina 2に追加される予定です。
- AIを責任を持って構築するということは、リスクに対処するだけでなく、人々や社会に最大の利益をもたらすということを意味します。私たちは独自のモデルをテストし、弱点を特定するために「レッドチーム」という業界標準の手法を用いてモデルを改善しています。
- さらに、Geminaに基づいて調整された新しいモデルファミリーであるLearn LMを紹介することもできます。YouTubeでの新機能もその一例であり、Learn LMを使用して教育ビデオをよりインタラクティブにし、質問やクイズを行うことができます。
- これらすべての進展は、AIを誰もが役立つものにするために、大胆かつ責任あるアプローチを取りながら進化していることを示しています。私たちの前にある可能性と、それを共に創りあげる喜びに乾杯しましょう。
未来への可能性:GeminiとAIの革新的な進化
Conclusion:
GeminiとAIの結合は、未来の可能性を切り拓く革新をもたらしています。Geminiの進化を追いかけ、AI技術の発展に期待が高まります。