Kreative Powerpoint-Designs mit KI: Claude 3 Vs Gemini Vs GPT-4
By Sam Witteveen · 2024-03-22
In der Welt der Künstlichen Intelligenz werden PowerPoint-Präsentationen immer besser. Aber wer erstellt die aufregendsten Designs? Eine Untersuchung von Claude 3, Gemini und GPT-4.
Die Macht der KI: Erstellung von PowerPoint-Präsentationen mit LLMS
- Gestern bin ich auf einen Tweet gestoßen, der mich zum Nachdenken gebracht hat. Es ging um die Idee, dass LLMS (Large Language Models) für weiße Kragenarbeitnehmer wirklich eine Bedrohung darstellen werden, wenn sie ansprechende PowerPoints besser erstellen können als Menschen. Obwohl ich das halb amüsant fand, dachte ich auch, dass es irgendwie wahr ist, dass viele Leute scheinbar nur damit beschäftigt sind, Präsentationen zu erstellen und vielleicht noch dazu E-Mails zu bearbeiten. Also entschied ich mich, einfach mal auszuprobieren, wie der aktuelle Stand der Erstellung einer PowerPoint-Präsentation mit einem LLMS ist. Ich habe mich bewusst gegen die Verwendung eines Agenten-Frameworks entschieden, aber vielleicht werde ich dies in Zukunft noch einmal tun und untersuchen, wie sich das verbessern ließe. Ich habe also einfach die Top-LLMS ausgewählt, nämlich Chat GPT Plus (GPT-4), Claude3 Opus und das Google Gemini 1.5 Pro-Modell. Wo möglich werde ich dieselben Anfragen für jede dieser Modelle verwenden und versuchen, diese konsistent durchzuziehen. Ich beginne also mit Chat GPT Plus oder GPT-4 und stelle eine sehr allgemeine Frage: Was ist der beste Weg, um eine PowerPoint-Präsentation zu erstellen?
Die Macht der KI: Erstellung von PowerPoint-Präsentationen mit LLMS
Die Fünf Guten Kaiser Roms
- Programmatisch betrachtet, siehst du, dass es eine Reihe von verschiedenen Paketen oder Frameworks vorschlägt, mit denen du dies tun kannst. Ich bin mir nicht sicher über Markdown oder Latch, aber wir haben hier einige interessante Ideen. Wenn ich dasselbe an Claude weitergebe, fällt auf, dass auch hier eine Liste verschiedener Arten von Frameworks angezeigt wird. Eines der schönen Dinge dabei ist, dass tatsächlich Codebeispiele angezeigt werden, wie ich das während des Durchlaufens sehen kann. Und schließlich, wenn ich es Gemini 1.5 Pro gebe, siehst du, dass wir ähnliche Arten von Informationen erhalten, die über verschiedene Frameworks sprechen, obwohl einige der Frameworks hier anders sind. Es ist fast so, als würden sie alle versuchen, etwas zu klären, wie z. B. in welcher Sprache du arbeitest. Nun werde ich mit dem gleichen Einsatz bei allen von ihnen fortfahren, um dies zu verdeutlichen. Ich werde es bitten, eine Reihe von Folien über die fünf guten Kaiser Roms zu erstellen. Wenn du einfach nach einem Google-Generative KI-Suchvorgang für die fünf guten Kaiser Roms suchst, weiß sie klar, um welche Kaiser es sich handelt und
Die Fünf Guten Kaiser Roms
Die Fünf Guten Römischen Kaiser: Eine Werbeagenturpräsentation
- Es wird mir dies als generativer Inhalt gegeben. Mit einem LLM davor. Dann gibt es mir tatsächlich Suchergebnisse usw., sodass wir wissen, dass ein LLM wissen sollte, wer diese fünf Kaiser sind usw. Ich habe das im Voraus geklärt. Ich habe auch ein paar Bücher über sie besorgt und in Textdateien umgewandelt, damit wir sie hochladen können und der LLM sie vielleicht als Ressource für eine zweite Runde verwenden kann, etc. Hier ist also der nächste Text, mit dem ich arbeite. Ich werde klarstellen, dass ich Python verwende. Geben Sie mir ein Code-Beispiel, das 10 Folien über die fünf guten römischen Kaiser generiert. Ich möchte wahrscheinlich zwei Folien für jeden von ihnen erstellen. Es soll kreativ und sehr stilvoll sein, als ob es von einer Werbeagentur entworfen wurde, die Anzeigen für Paul Smith erstellt. Für die Informationen auf den Folien sollen die Top fünf Errungenschaften des Reiches stehen. Für den Inhalt gehen Sie vor, als wären Sie eine Top-4-Beratungsfirma, die eine Pitch-Präsentation erstellt. Ich bin wirklich gespannt, wohin sie bei denselben Dingen gehen und wo sie sich stark unterscheiden. Ich habe GBD4 da drüben, lasst uns das nur mal ausprobieren.
Die Fünf Guten Römischen Kaiser: Eine Werbeagenturpräsentation
Eine Nachbildung eines innovativen Projekts
- Ich bin wirklich gespannt, zu sehen, wo sie sich ähnlich sind, wo sie sich unterscheiden, nicht nur im konkreten Inhalt, sondern auch in der Art und Weise, wie sie darauf reagieren. Interessant ist, dass dieser den Untertitel 'Ein Pitch von den Top vier Consulting' erhalten hat. Vielleicht hätte ich die tatsächlichen Consulting-Namen dort verwenden sollen. Lassen Sie uns das diesem Gemini überlassen und das andere abschalten und währenddessen schauen, was j4 gemacht hat. Hier können wir sehen, dass sie sich alle für dieses spezielle Paket entschieden haben, das ich zuvor nicht verwendet habe. Schließlich werde ich versuchen, diese aufzubauen und sehen, wie sie tatsächlich aussehen. Fügen Sie eine Folie hinzu, die eine Funktion hat. Okay, es sieht so aus, als ob es die fünf Kaiser richtig hat, wir haben Nero, Trajan, Hadrian, Antoninus Pius und Marcus Aurelius. Es setzt diese zusammen. Ich sehe hier nicht wirklich etwas über das Styling, also dieser Code bietet eine grundlegende Struktur, um den Stil von Psmith wirklich einzufangen. Um dies wirklich zu erfassen, sollten Sie dies mit diesem Code ergänzen. Schauen wir mal, ob die anderen dasselbe tun. Es hat also im Grunde begonnen, es hat Paul Smith Farben, also ist das sehr interessant. Wenn man schnell nach den Paul Smith Farben googelt, kann man eine Vorstellung von dieser Art von gestreiften Farbe bekommen, also hat es definitiv einige interessante.
Eine Nachbildung eines innovativen Projekts
Die Verwendung von Farben in der Gestaltung
- Farben, ich frage mich, wie sie tatsächlich hier verwendet werden, und wir können sehen, dass auch die Spitzenleistungen jedes einzelnen schön definiert sind. Ich glaube, ich habe gesagt, dass die fünf besten Leistungen aus dem Gedächtnis stammen. Ja, ich habe die fünf besten Leistungen gesagt. Es scheint, als hätte man darauf geachtet und recht gut darauf reagiert. Es wird uns im Grunde genommen sagen, dass dies bereits erledigt ist und bereit ist zu gehen. Ich denke, dass wir es hier versuchen werden, aufzubauen. Bei Gemini haben wir hier etwas Interessantes, wo es für zwei der Kaiser gemacht wurde, dann aber nur gesagt hat, füge Details für die anderen hinzu, und dann nicht wirklich etwas über die Farben oder irgendetwas hat, obwohl es einen Schriftfont namens Pouth Handwriting hat, wieder ziemlich interessant, weil das irgendwie wie eine Art Schrift aussieht. Meine Vermutung ist, dass es wahrscheinlich nicht einfach ist, diese Schrift zu bekommen. Okay, ich sehe keinen direkten Link zu dieser Schrift, wenn ich tatsächlich nachschaue. Was habe sie sonst noch hier drin? Für dieses Okay. Die erste wichtige Sache, denke ich, ist, ihm zu sagen, dass er mir die Details für alle fünf Kaiser geben muss. Also werde ich den anderen die gleiche Aufforderung geben, obwohl ich denke, dass die Claude-Sache das vielleicht schon getan hat, aber lass uns sehen.
Die Verwendung von Farben in der Gestaltung
Fehlerkorrektur und Verbesserungen im Codeprozess
- Lassen Sie uns das einfach für jede dieser Folien durchlaufen. Tatsächlich hat diese Folie etwas in Richtung dessen getan, was wir hier tatsächlich wollten, und dieses Mal haben wir definitiv eine schönere Formatierung dafür erhalten. Hier ist also der vollständige Code mit den Details für jeden Kaiser und den Inhalt für jede Folie. Es scheint, als hätte ich beim Kopieren einige Fehler gemacht, denn für einige von ihnen hatte ich eine Folie für jeden von ihnen, und für die Chat-GB-Folie hatte ich zwei Folien für jeden von ihnen, obwohl anscheinend keine zusätzlichen Folien erstellt wurden. Es scheint, als bleibe es bei einer Folie für jeden von ihnen. Ich werde den Code nun kopieren und die Pakete installieren, um tatsächlich zu sehen, wie all dies funktioniert. Ich habe es geschafft, den Code für jede dieser Folien in VS Code zu bekommen. Sie können sehen, dass ich einen für die Chat-GBT-Folien, einen für die Clawed-Folien und einen für die Gemini-Folien habe. Ich muss sagen, dass der Gemini-Teil Fehler enthielt und ich mehrmals darauf zurückkommen musste, um es zu bitten, seine eigenen Fehler zu beheben, da ich sie absichtlich nicht selbst beheben wollte. Es war im Grunde nur ein Vergessen, verschiedene Dinge hier zu importieren, und es war nur, als ich im Grunde sagte, komm schon, du musst dich zusammenreißen.
Fehlerkorrektur und Verbesserungen im Codeprozess
Eine gründliche Überarbeitung der Präsentationsfolien
- Ich möchte mich aufrichtig entschuldigen für wiederholte Fehler. Sie haben absolut recht, diese Fehler sind inakzeptabel. Ich habe alle Codes dort tatsächlich korrigiert. Ich bin jeden einzelnen durchgegangen und habe sie einfach ausgeführt, um den Namen am Anfang zu ändern, damit wir wissen, woher sie stammen. Als nächstes werde ich sie im Google Slides hochladen, da ich PowerPoint auf diesem Rechner nicht habe. So können wir uns das Ergebnis dort ansehen, auch wenn das wahrscheinlich nicht der perfekte Weg ist, um diese zu bewerten. Aber zumindest können wir sehen und einen Eindruck davon bekommen, was sie vorhatten. Eine andere Möglichkeit, sie zu überprüfen, ist, das Vorschau-Tool auf dem Mac zu verwenden. Die Chat GPT-Folien sehen ziemlich normal und langweilig aus, aber der Inhalt scheint vernünftig zu sein. Es konzentriert sich auf Mickos' realistische Meditationen und enthält einige andere interessante Elemente. Wenn wir uns die Folien zu 'Clawed' ansehen, erkennen wir, dass er definitiv einige Farbideen aus der Pul Smith Geschichte aufgreift. Das Layout der Folien ist jedoch ziemlich langweilig und muss verbessert werden.
Eine gründliche Überarbeitung der Präsentationsfolien
Die Optimierung von Google Slides-Präsentationen
- Wir haben sie wirklich auf eine schöne Weise proportioniert, aber wir haben die regierenden Daten für jede davon, obwohl sich einige überschneiden, was nicht ideal ist. Beim Gemini-Teil sehen wir im Grunde genommen einige Wiederholungen, und ich vermute, dass uns etwas fehlt. Das könnte daran liegen, dass wir uns etwas Schwarz auf Schwarz ansehen. Wenn wir diese rüberholen und in Google Slides einfügen, können wir sehen, wie sie aussehen werden. Chat GPT1 hat anscheinend etwas erhalten, obwohl es so aussieht, als würde es auf Google Slides über den Rand hinausbluten, was wahrscheinlich ein Problem von Google Slides ist und nicht von PowerPoint. Hier haben wir wiederum die Inhalte, aber das Layout ist nicht optimal. Beim Gemini-Teil ist es interessant, dass die Fehler, die der Gemini-Teil erhalten hat, darauf zurückzuführen waren, dass er versuchte, Bilder einzufügen, die jedoch nicht existierten. Man könnte sich vorstellen, dass wir ihm mitgeteilt hätten, 'Hier sind die fünf Bilder, die wir haben, benutze diese hier', oder so ähnlich, dann hätten wir bessere Ergebnisse erzielen können. Es ist jedoch nicht gut, wenn es uns im Grunde genommen Transaktionen und eine von fünf Errungenschaften gibt.
Die Optimierung von Google Slides-Präsentationen
Die Bedeutung von Design und Kreativität in der Content-Erstellung
- Eine wichtige Errungenschaft war, dass er als einer der fünf guten Kaiser angesehen wurde, was nicht wirklich den Kontext dessen widerspiegelt, was wir hier verfolgen. Erneut mit Marcus Aurelius scheint die Idee, dass eine seiner Leistungen das ist, worum es bei dem Deck wirklich geht, für mich nicht verstanden zu haben. Es scheint jedoch, dass das Hauptproblem das Problem um das Design herum ist. Ich möchte nun ein Produkt in Betracht ziehen, das ich recht häufig verwende und das sich darum dreht, dass LLMs durch bestimmte Komponenten schöne Designs erstellen. Auch wenn es nicht direkt PowerPoint-Folien erstellt, sondern Websites. Lassen Sie uns eintauchen und uns das genauer ansehen. Ein weiterer Dienst, der zwar nicht genau PowerPoint ist, aber in derselben Liga spielt, ist der von Websites. Dieser Service namens VZ Dodev, erstellt von Verel, nimmt im Grunde genommen eine Eingabe von mir und erstellt eine Website über die fünf guten Kaiser mit Abschnitten, in denen Bilder und Profile für jeden Kaiser angezeigt werden und ihren Namen zeigen. Ich habe ihr nichts über die fünf Kaiser erzählt. Es nutzt im Grunde genommen das große Sprachmodell, das dies ausführt. Ich vermute, dass es sich dabei um OpenAI handelt, aber es hat entweder viele gute Dinge im Kontext oder ein feinabgestimmtes Modell. Letztendlich erstellt VZ Dodev Websites und
Die Bedeutung von Design und Kreativität in der Content-Erstellung
Eine Überarbeitung des Textes mit kreativer Referenzierung
- Sie können vorbeikommen und sie sich ansehen, damit wir hier feststellen können, dass wir fünf gute Kaiser haben: Emor Tran, Hadrian und okey. Es hat einen von ihnen falsch gemacht und Nerva, den ersten, ausgelassen. Es hat Melas' Sohn hinzugefügt, der wahrscheinlich nicht als einer der guten Kaiser angesehen wurde - er war ein wenig verrückt. Wenn wir uns jedoch einige der anderen ansehen, sehen wir hier wieder, dass es inhaltlich einiges falsch macht, aber stilistisch ist es definitiv viel interessanter. Ich habe die Informationen über die Werbeagentur noch nicht eingefügt; das können wir gerne ausprobieren. Es hat jedoch keine gute Arbeit damit geleistet. Die ganze Idee bei v0 ist, dass, sobald Sie etwas haben, Sie es dann neu auffordern können. Jetzt kann ich es im Grunde fragen, die Farben eines Paul Smith Designs verwenden. Schauen wir mal, was es im Grunde tun wird, es wird das, was wir dort hatten, übernehmen und sozusagen neu gestalten. Offensichtlich haben wir uns zuvor die Paul Smith-Farben angesehen: sehr extravagant, sehr bunt. Es hat den bunten Aspekt bekommen, aber ich sehe nur zwei Farben hier, das ist nicht gerade ideal. Aber eines der Dinge, die ich mir vorstelle, ist, dass man sich einen Dienst oder eine Agentur vorstellen könnte, die es Ihnen dann ermöglicht, den Folienoutput anzusehen und ihn sozusagen neu anfordern und verbessern zu können, und zu sagen: 'Okay, mir gefällt, wie Sie diese Folie gemacht haben...
Eine Überarbeitung des Textes mit kreativer Referenzierung
Neuartige Methoden zur Farbanpassung von Folien mit KI-Technologie
- Ändern Sie diese andere Folie. Ich brauche mehr Informationen darüber, ich brauche mehr Informationen darüber und ich denke, dass das wahrscheinlich nicht so weit weg ist. Meine Vermutung ist, dass es wahrscheinlich Start-ups gibt, die bereits daran arbeiten, falls es noch keine Produkte gibt, die das wirklich tun. Es ist eine interessante Herausforderung, die meiner Meinung nach definitiv lösbar ist. Das Problem besteht darin, wie man Designmerkmale behandelt und Farben usw. einfügt. Ich nehme einfach die Farben von der geklonten Version und sage einfach, mach sie mit diesen Farben neu, damit du sehen kannst, dass es auch beim Neu erstellen hier darauf achten möchte, sich auf eine begrenzte Anzahl von Farben auf der Seite zu beschränken. Das könnte etwas in seinem Hinweis sein, dass es nicht zu viele Farben gibt oder dass es sich auf zwei oder drei Farben konzentrieren soll, was es sowohl bei der gelben Version als auch bei dieser anderen Version zu tun scheint. Wie dem auch sei, ich dachte, das wäre eine spaßige kleine Übung, um ein Gefühl dafür zu bekommen, wie unterschiedlich oder wie ähnlich die Chat-GPT-Modelle, die Claud-Modelle und die Google-Modelle sind, wenn wir sie tatsächlich zusammenstellen. Wie Sie aus den Folien sehen können, die wir erhalten haben, haben wir noch einen langen Weg vor uns, bevor wir dies nur mit dem Regal-LLM tun können. Wir werden wahrscheinlich einen Agenten benötigen.
Neuartige Methoden zur Farbanpassung von Folien mit KI-Technologie
Die Zukunft des Designs und der künstlichen Intelligenz
- Es braucht eine Art funktionale Anregung und ein System, das etwas mehr über Design versteht und darüber, wie man es umsetzen kann. Ich finde es interessant, dass die KI in der Lage war, die Informationen zu liefern, die wir gesucht haben. Man könnte sich vorstellen, dass sie bereits mit Kontext für Ihr Unternehmen oder Ihr Projekt vorab geladen ist. Sie würde in der Lage sein, das zu verstehen, besonders wenn man sich vorstellt, dass man beispielsweise eine Aufzeichnung eines Meetings zu dem Projekt, eine Reihe von Vereinbarungsnotizen, die man für dieses Projekt gemacht hat, hat. Sie sollte in der Lage sein, solche Dinge zu tun. Ich denke, die Herausforderung wird darin bestehen, das Design wirklich elegant aussehen zu lassen und den Stil auf eine Weise zu gestalten, mit der die Menschen zufrieden sind. Ich denke, es gibt einige Werkzeuge zur Erstellung von Präsentationen, bei denen man, sobald man die Fakten eingetragen hat, einfach auf die Schaltfläche klicken und die Stile so lange ändern kann, bis man etwas findet, das einem gefällt. Man könnte sich vorstellen, dass das hier wirklich gut funktionieren würde. Dies ist nur eine kleine spielende Sache, die ich am Wochenende ausprobieren wollte. Lass mich wissen, was du denkst, lass mich wissen, wie man das verbessern könnte. Wenn die Leute wirklich interessiert sind, schaue ich mir vielleicht an, wie man so etwas mithilfe eines Agenten oder einer anderen Art von System verbessern kann. Ich werde versuchen, es besser zu machen, während wir vorankommen. Wie immer, wenn dir das Video interessant erscheint, klicke bitte auf „Gefällt mir“ und abonniere. Ich spreche mit dir im nächsten Video. Tschüss für jetzt.
Die Zukunft des Designs und der künstlichen Intelligenz
Conclusion:
Die Zukunft der PowerPoint-Präsentationen liegt in KI-Modellen wie Claude 3, Gemini und GPT-4. Diese Studie zeigt, wie sich diese Modelle in der Erstellung von Präsentationsdesigns unterscheiden.