GoogleのGNoME AI:800年の飛躍で2,200,000の新発見を実現
By AI News · 2024-04-07
GoogleのGNoME AIとは何か、その驚異的な進化と成果について解説します。新たな素材科学への革新と未来への展望を紹介します。
未来への一歩:P Labsがビデオ制作を変革する
- 最近、Google Deep Mindが最新のノームAIをリリースし、P Labsが驚異的な進化を遂げたAIで、ピクサー品質レベルのビデオを生成および編集する能力を発表しました。また、Metaは3つの新しいAIモデルをデモ公開しました。
- しかし、まずはP Labsの起源について探求し、彼らがビデオ制作を変革するために立ち上げた新しい7つの機能を探ってみましょう。P Labsは2023年4月に、スタンフォード大学のコンピュータサイエンスのPh.D.学生2人によって設立され、Runwayという生成的AIビデオスタートアップからのビジョンとインスピレーションによって生まれました。
- 創業者たちは、テキストからビデオ、画像からビデオ、ビデオからビデオのより直感的で使いやすいプラットフォームを作ることを決意し、それがP Labs誕生のきっかけとなりました。P Labsは、Discordでのローンチから1年足らずで50万人以上のユーザーと5,500万ドルの資金調達を集め、急速に人気を博しています。
- P Labs 1.0は、ランウェイからインスピレーションを受けたスリークでミニマリストなスタイルでユーザーエクスペリエンスを向上させることに焦点を当てています。また、探索モードなどの機能を統合し、ユーザーにさまざまなアートワークへのアクセスを提供しています。Discordバージョンからのコア機能は維持されつつ、リフレッシュされたフォーマットで提供され、モバイルアプリの今後のリリースも予定されています。
未来への一歩:P Labsがビデオ制作を変革する
AIビデオ技術の最新動向:革新的な進化と未来への展望
- AI技術は急速に進化し、Pica 1.0の登場によりビデオ編集の世界に革新がもたらされています。この新機能は、ユーザーがテキストプロンプトを使用して既存のビデオをさまざまなスタイルに変換できるビデオ編集機能を提供しています。
- AIによる編集技術も進化し、Pica 1.0では、様々なソーシャルメディアフォーマットに対応するように、ビデオのアスペクト比を自動調整する機能も導入されています。TikTok、Instagram、YouTube Shortsなどに最適化された機能は、ユーザーにより広範な編集オプションを提供しています。
- また、Pica 1.0は生成的フィル編集ツールを導入し、シーン内の要素を簡単なプロンプトで置き換えることができる機能も提供しています。まだ初期段階ではありますが、この機能はエンターテイメント業界のクリエイターにとっても可能性を秘めており、高品質なCGIアニメーション機能は特に興味深いものとなっています。
- これらの革新的な進化により、Pica 1.0の高品質なCGIアニメーション能力は、PixarやDreamWorksのような名だたるスタジオに迫るクオリティを実現しています。リアルな照明や説得力のある表情表現など、これまでにないレベルのテクノロジーが提供されています。
- さらに、Pica 1.0の重要なアップデートとして、3秒以上のクリップ長を可能とする機能が拡張されました。これにより、ユーザーはより柔軟かつ創造的な動画プロジェクトを実現できるようになりました。Picaの成長はAIビデオ技術の分野における旅路であり、Adobe SystemsのRephraseの買収やMetaのmuビデオの導入など、他の企業もAI技術によるビデオ編集への関心が高まっています。
AIビデオ技術の最新動向:革新的な進化と未来への展望
AIの進化が未来の素材科学を革新する
- AI(人工知能)の進化は、未来の素材科学を革新し、市場における競争をさらに激化させています。Google Deep Mindが新たに発表したAIツール「gnome(ノーム)」は、従来の結晶研究方法では800年かかった作業を短時間で達成することができる素材科学の革命をもたらしました。
- 最近の出版物に詳細が記載されているように、gnomeは2.2百万個以上の新しい結晶を特定し、そのうち約380,000個の安定化合物を特定しています。これらの技術は、先進の超伝導体から改良された電池、革新的な半導体までの幅広い応用を持つ可能性があります。
- 伝統的に新しい無機結晶を見つける作業は遅くて煩雑なプロセスでしたが、gnomeはゲームを変える手法を採用しています。グラフィンネットワークを利用して、新しい材料を特定するだけでなく、それらの安定性を予測しています。この方法は、数世紀にわたって可能だったより短い時間でより多くの材料を発見することを約束します。
- gnomeの効率は、AIと量子物理学を組み合わせたアクティブラーニングというプロセスの結果です。Materials Projectから既知の材料に関する公開データで最初にトレーニングされ、gnomeのパフォーマンスは、新しい材料の提案を行い、その安定性を量子物理学的密度決定理論を通じてテストすることで大幅に向上しました。AIによる材料の安定性の予測精度は50%から80%以上に向上しました。さらに、Deep Mindはモデルの効率を向上させることに成功しました。
AIの進化が未来の素材科学を革新する
次世代材料研究の最新動向:AIがもたらす革新と未来への展望
- 最近の研究によると、新たな材料の発見率は10%未満から80%以上に向上しています。この進歩により、1つの発見に必要な計算リソースが削減され、新しい材料の開発が加速しています。
- 遺伝子解析AI「gnome」による予測のいくつかは既に他の研究所で実証されており、予測された新しい結晶のうち736個が合成されました。さらに、最も安定した38万個の候補のデータは公開され、世界中の研究者に新しい技術の開発に役立てる豊富な情報源となっています。
- 一方、バークレー研究所の実験ロボティクスラボ「alab」の研究者たちは、17日間で41種類 の新しい材料を自動プロセスで合成しました。このシステムは自律的に原料を選択し、合成を行い、結果を分析しました。
- しかし、自動化された研究室の進歩にもかかわらず、gnomeなどのシステムによって同定される理論的構造の数は現在の合成能力を超えています。これは、新しい材料の予測だけでなく、どれが合成の価値があるかを決定できるAIの重要性を示しています。
- 一方、メタは最新のAI研究プロジェクト「ego EXO 4D」「シームレスコミュニケーション」「オーディオボックス」を発表しました。これらのプロジェクトは、メタがビデオ学習、翻訳、音声生成などの様々な分野でAI技術を前進させ続ける能力を示しています。
- 最初のプロジェクト「ego EXO 4D」は、ビデオ学習と多角的知覚の大きな飛躍を表しています。このデータセットとベンチマークは、最新のAI技術の基盤を提供し、未来の技術革新に向けた展望を示しています。
次世代材料研究の最新動向:AIがもたらす革新と未来への展望
未来のAI技術:メタの革新的なプロジェクトを紹介
- メタの基本的なAI研究プロジェクトAryaと15のグローバル大学パートナーによる連携により、2年にわたるデータ収集が行われました。このプロジェクトは、カメラ付きヘッドセットからの自己中心的な視点と周囲のカメラからの外中心的な視点をユニークに組み合わせています。
- 主な焦点は、スポーツ、音楽、料理などの複雑な人間の活動を捉えることにあります。このデータは、AI研究向けの貴重な情報を提供し、メタはこれを通じてAIシステム、ロボット学習、ソーシャルネットワークの向上を目指しています。
- メタは、この約1,400時間のビデオデータセットを12月にオープンソース化し、翌年にはベンチマーク競技会を予定しています。
- 二つ目のプロジェクトは、シームレスコミュニケーションであり、言語翻訳を革新するAI研究モデルのスイートです。シームレスm4tモデルを基にしたこのプロジェクトでは、シームレスエクスプレッシブ、シームレスストリーミング、シームレスm4t V2、そして統合されたシームレスモデルが導入されています。
- これらのモデルは、話し方のニュアンスを保持し、翻訳の遅延を減らし、言語間でのスムーズなボイスおよびテキスト通信を可能にすることを目指しています。
- シームレスエクスプレッシブのデモでは、音声翻訳を強調することで、メタがコミュニケーションをより自然で障壁のないものにする取り組みが示されています。
- 三つ目のプロジェクトであるオーディオボックスは、音声用ジェネレーティブAIへのメタの進出を表しています。前身であるボイスボックスを成功させたオーディオボックスは、ユーザーが声入力とテキストプロンプトを通じて特定の声や効果音を生成できるようにすることで、作者が独自のオーディオコンテンツを簡単に制作できるようにするモデルです。
未来のAI技術:メタの革新的なプロジェクトを紹介
Conclusion:
GoogleのGNoME AIの登場は、AI技術の未来と素材科学の革新に道を開きました。新たな発見は未来の進化を示唆し、さらなる革新が期待されます。