クロード3対ジェミニ対GPT-4:誰が素晴らしいパワーポイントを作成できるのか?
By Sam Witteveen · 2024-03-22
LLMがPowerPointデッキを作成する方法について。主要なLLMであるChat GBT Plus、Claude 3 Opus、Google Gemini 1.5 Proモデルの能力を検証しました。それぞれのモデルで構築されたスライド、そのデザインの違い、そしてAIによるデザイン支援システムの可能性について探りました。
LLMがPowerPointデッキを作成する方法
- 昨日、興味深いツイートを見つけました。それは、LLMが人間以上にスリックなPowerPointを生成できるようになると、白カラーのプロフェッショナルにとって脅威になる可能性があるという考えについて興味深いものでした。私はこれを半面面白いと思いつつも、多くの人の仕事がPowerPointを作成し、その上でメールをするだけのように見えるという点は本当だと思いました。そこで、今どのようにllmを使ってPowerPointデッキを構築しているのかを試してみることにしました。私は意図的にエージェントの種類のフレームワークを選択せず、今後、この種のビデオを再度作成し、エージェントフレームワークでどのように改善されるかを見てみたいと考えています。今回は、主要なllmsを取り上げ、Chat GBT Plus(GBT 4)、Claude 3 Opus、Google Gemini 1.5 Proモデルの3つを選択しました。可能な限り同じプロンプトを使用し、すべてのモデルで同じプロンプトを試してみることにしました。さて、ますはChat GPT PlusまたはGPT 4から始めましょ う。私は非常に一般的で単純な質問をしました。「PowerPointスライドデッキを作成する最良の方法は何ですか?」
![LLMがPowerPointデッキを作成する方法](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/1/segment_1.webp)
LLMがPowerPointデッキを作成する方法
ローマの五賢帝についてのスライドを作成するAIの能力を検証する
- プログラムによって、AIが提案するいくつかの異なるパッケージやフレームワークを見ることができます。いくつかのアイデアがここにあります。クロードに同じものを与えると、異なる種類のフレームワークのリストが表示されます。それが行く道の様子を見せるコード例を実際に提供しています。最後に、Gemini 1.5 Proに同じものを提供すると、異なるフレームワークについて話していますが、言語の選択などを明確にしようとしているようです。これを明確にするために、すべてのAIに同じプロンプトを続けて提供し、ローマの五賢帝に関するスライドを作成するように依頼します。Googleで「ローマの五賢帝」を検索すると、該当の皇帝を把握しています。
![ローマの五賢帝についてのスライドを作成するAIの能力を検証する](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/2/segment_2.webp)
ローマの五賢帝についてのスライドを作成するAIの能力を検証する
五賢帝の功績:パウル・スミス風の広告スライド
- パウル・スミスの広告代理店がデザインしたかのような創造的でスタイリッシュな広告用スライドを作成するために、Pythonコード例を使用して、五賢帝の功績に関するスライドを10枚生成する必要があります。それぞれに2枚のスライドがあるようにしたいので、各五賢帝に関するトップ5の業績を内容とします。スライドの情報には、トップ戦略コンサルティング企業がピッチデッキを作成しているかのように、五賢帝の業績を含めてください。
![五賢帝の功績:パウル・スミス風の広告スライド](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/3/segment_3.webp)
五賢帝の功績:パウル・スミス風の広告スライド
ポール・スミスのカラーパレットを活用したエンペラースライドの構築
- こちらのソフトウェアによって、ポール・スミスのカラーパレットが取り入れられています。興味深いことに、ストライプ模様のカラーが定義され、ユニークなデザインが施されています。エンペラースライドでは、ナルヴァ、トラヤヌス、ハドリアヌス、プス、そしてマルクス・アエリウスといったエンペラーの名前が使用されています。重要なポイントとして、コードは基本構造を提供していますが、ポール・スミスのスタイルを本当に捉えるにはさらに工夫が必要です。
![ポール・スミスのカラーパレットを活用したエンペラースライドの構築](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/4/segment_4.webp)
ポール・スミスのカラーパレットを活用したエンペラースライドの構築
ビルマの最高の宝石コレクション
- 色についてどのように使用するかを実際に考えています。また、それぞれのトップアチーブメントがきれいに定義されていることもわかります。記憶からのトップ5つの実績を挙げたと思いますが、これがすでに完了しており、進行中であることを示しています。ジェミニをビルドしようとしているようです。ジェミニには興味深い点があります。2人の皇帝については対応していますが、他の皇帝の詳細を追加するように言っているだけで、プスミスの色などについては何もありませんが、手書きのフォント名を持っています。フォントのようなものがあるので、そのフォントを手に入れるのは簡単ではないと思われます。実際に検索してみると、直接のリンクは見当たりません。他に何があるか確認します。最初の重要な点は、すべての5人の皇帝の詳細を教える必要があるということです。他のものにも同じ提示を行います。クロードのものはすでに行われているかもしれませんが、確認してみましょう。
![ビルマの最高の宝石コレクション](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/5/segment_5.webp)
ビルマの最高の宝石コレクション
コードエディタにコードをコピーし、パッケージのインストールを行います
- それぞれのスライドについて、コードをコピーし、必要なパッケージをインストールします。VSSコードにコードを取り込んだところ、チャットGBTスライド、クロードスライド、ジェミニスライドそれぞれのコードが確認できます。ただし、ジェミニスライドにはエラーがあり、複数回戻って修正を求める必要がありました。自ら修正を加えず、エラーを自己修復させるよう求めたところ、異なるものをインポートし忘れていたことが原因だったようです。ここで、実際にこれらがどのように機能するかを確認し始めましょう。
![コードエディタにコードをコピーし、パッケージのインストールを行います](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/6/segment_6.webp)
コードエディタにコードをコピーし、パッケージのインストールを行います
エラー修正とプレゼンテーション準備
- ものすごくすいません。繰り返しのエラーについて本当に申し訳ございません。これらの間違いは許容できないものです。実際にすべてのコードを修正しました。各々を基本的に通して、走らせて、最初に名前を変えるだけで、元のコードがど こから来たのかがわかるようにしました。次にやることは、基本的にそれらをアップロードすることです。このマシンにはPowerPointがないので、Googleスライドにアップロードします。そこで見て、これらを評価する完璧な方法でないことを知ってますが、少なくとも、何を考えていたか、何をしていたかが分かります。別の方法として、Macのプレビューツールを使ってチェックすることもできます。これはChat GPTの物です。かなり普通でつまらないスライドです。内容は徹底的にはチェックしていませんが、かなり正確そうです。マイコスリアリストの瞑想に焦点を当て、いくつか異なる要素が含まれています。クロドのものを見てみると、色があるのは確かです。プルスミスのものから色のアイデアを引き出しています。スライドのレイアウトは非常につまらないですね。
![エラー修正とプレゼンテーション準備](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/7/segment_7.webp)
エラー修正とプレゼンテーション準備
Google SlidesとPowerPointの比較
- 実際には、それらを非常にうまく整理することはできませんが、各々の支配期間があります。重なり合っている部分もあるため、理想的とは言えません。また、Geminiの場合、ある種の繰り返しのようなものがあります。おそらく何かが欠落しているのだと思われます。これは黒地に白字のものを見ているためかもしれません。これらを持ってきてGoogleスライド に表示してみると、GPT-1のチャットが表示されていることが分かります。ただし、Googleスライドではエッジにかけて滲んでしまっているように見えますが、これはおそらくGoogleスライドの問題であってPowerPointの問題ではない可能性があります。Geminiの場合は、興味深いことに、Geminiが受け取っていたエラーは、画像を挿入しようとしていたためでした。ただし、それらの画像が存在しなかったためエラーが発生していました。したがって、ここには改善の余地があります。ここにはうまいレイアウトがあるわけではありませんが、これを十分に活用すれば、より良い結果が得られるかもしれません。
![Google SlidesとPowerPointの比較](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/8/segment_8.webp)
Google SlidesとPowerPointの比較
VZ Dodev: クリエイティブなウェブサイト作成サービス
- VZ Dodevは、PowerPointスライドではなくウェブサイト作成に特化したサービスです。Verelによって作成されたこのサービスでは、特定のコンポーネントを使用してデザインを作成することが可能です。私が提示したプロンプトは、「五賢帝についてのウェブサイトを作成し、各皇帝の写真とプロフィールが記載されたセクションを持つこと」でした。五賢帝に関する詳細を一切伝えていなかったにも関わらず、この言語モデルがその情報を元にウェブサイトを作成しています。VZ Dodevはウェブサイトを作成するだけでなく、
![VZ Dodev: クリエイティブなウェブサイト作成サービス](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/9/segment_9.webp)
VZ Dodev: クリエイティブなウェブサイト作成サービス
スライドデザインを改善する革新的なアイデア
- ここで、我々は5人の優れた皇帝、エモラ・トラン・ハドリアンなどを見ることができますが、最初のネルヴァが抜けていることが分かります。逆に、あまり優れた皇帝とは考えられなかったかもしれないメラスの息子が追加されています。他のものを見ても、コンテンツの一部は誤っているようですが、スタイル的にはかなり興味深いものとなっております。広告代理店などに関する情報はまだ含まれていませんが、後で追加してみることができます。以前に見たように、Pスミスのカラーは非常に派手でカラフルで、このスライドでもカラフルさが感じられます。しかし、ここには2色しか表示されていないので、完璧とは言えないでしょう。このようなサービスやエージェントを想像してみると、スライドの出力を見て改善していくことができ、'このスライドの作り方は良いね、ただ...'というように指示できるかもしれません。
![スライドデザインを改善する革新的なアイデア](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/10/segment_10.webp)
スライドデザインを改善する革新的なアイデア
多様な色彩を活用した再設計作業
- 別のスライドを変更するには、さらに情報が必要です。あれやこれに関するさらなる情報を提供していただけますか?おそらくそれはそれほど遠くないでしょう。おそらく、この問題に取り組んでいるスタートアップが既に存在するかもしれません。存在していない場合でも、これを行うための製品がすでに存在している可能性があります。これは非常に興味深い問題であり、LLMを使用して取り組める可能性があると思います。問題は、デザイン機能や色彩などをどのように扱うかです。他のものから色を取り入れるだけで、これらの色で再構築することにしました。それを見ると、再構築中でも、ページ上の色の数を限定しようとする傾向があります。 promptの中であまり多くの色を使用しないように指示することがあるかもしれません。2、3色程度に絞り込むようにという指示があるかもしれませんが、黄色バージョンや他のバージョンのように、2、3色に集中しているようです。とにかく、これは楽しい小さな練習だと思いました。GPTモデル、Claudモデル、Googleモデルが実際にこれらを組み合わせ始めると、どれほど異なるか、似ているかを感じるためのものです。スライドからわかるように、私たちがこれをオフシェルフのLLMで行うまでにはまだ時間がかかります。おそらく、エージェントが必要になるでしょう。
![多様な色彩を活用した再設](https://cdn.heichat.net/files/web/heichat/blog_data/g3vroajaWwg/segments/12/11/segment_11.webp)