Midjourney v5: Ein Schritt näher an realistische KI-Grafiken

Es ist Juli 2022. Plötzlich gibt es ein lebensveränderndes Tool, das Bilder aus Text generiert: Midjourney. Nun, es war nicht das erste Tool, das künstliche Bilder erzeugte. Aber plötzlich gab es hochwertige Bilder statt Pixel. Dennoch gab es noch Mängel. Midjourney v5 wurde vor ein paar Tagen veröffentlicht. Was hat sich in sechs Monaten verbessert?

Im September habe ich einen ausführlichen Artikel über Midjourney auf Frankwatching geschrieben. Die Qualität war gut, aber man konnte trotzdem sehen, dass etwas mit den aufgenommenen Bildern nicht stimmte. Hände sahen noch nicht wirklich wie Hände aus und Gesichter sahen nicht immer frisch aus. Wir sind jetzt ein halbes Jahr weiter. Es ist höchste Zeit, in das Programm einzutauchen, um zu sehen, wie weit Midjourney in sechs Monaten gekommen ist.

Was ist nochmal Midjourney?

Kurz gesagt, Midjourney ist ein öffentlicher Server auf Discord. Sie können kostenlos auf diesen Server zugreifen. Mit Ihrem kostenlosen Konto können Sie mehrere Dutzend Textanfragen stellen. Das Programm erstellt dann vier Bilder basierend auf Ihrem Text. Das kann kurz und prägnant sein, aber auch super ausführlich. Es ist genau das, was Sie sehen wollen.

Nach einer Weile werden Ihnen die Textanfragen ausgehen und Sie können zu einer kostenpflichtigen Version wechseln. Es gibt mehrere Abonnements zwischen 10 und 60 US-Dollar pro Monat, mit denen Sie unbegrenzten Zugriff auf das Programm haben. Je mehr Sie bezahlen, desto mehr Optionen erhalten Sie in Bezug auf Qualität und Geschwindigkeit. Es ist auch möglich, Ihre Suchbegriffe privat auf Ihrem eigenen Server zu verwenden.

So verwenden Sie Midjourney

  • Gehe zu https://www.midjourney.com/home/
  • Klicken Sie auf „An der Beta teilnehmen“
  • Erstellen Sie ein Konto auf Discord
  • Anmeldung
  • Wählen Sie einen der Newbie-Bots auf der linken Seite aus
  • Geben Sie /imagine ein und tippen Sie aus, was Sie sehen möchten

Neu in Midjourney v5

Letzten Juli mussten wir uns mit der ersten Version von Midjourney auseinandersetzen. Jetzt sind wir bei v5 angekommen. Hier sind die größten Änderungen in Midjourney v5 im Vergleich zu v4:

  • Eine Hochskalierung auf eine höhere Auflösung ist nicht mehr notwendig. Sie erhalten die generierten Bilder – alle vier – sofort in höchstmöglicher Auflösung.
  • Es ist möglich, mehrere Seitenverhältnisse anzuwenden, z. B. 3:1 oder 1:4. In früheren Versionen war dies 1:2 oder 2:1.
  • Sie haben mehr Kontrolle über die kleinsten Details in Ihrer schriftlichen Aufforderung.
  • Fügen Sie mehrere Bilder hinzu und geben Sie an, wie viel Ihnen jedes Bild im Endergebnis wert ist. Auf diese Weise geben Sie an, welches Foto Sie im Vergleich zu einem anderen mehr zeigen möchten.
  • Zehen und Finger sehen jetzt realistischer aus.
  • Reflexionen sind natürlicher.

Das hört sich alles gut an! Deshalb ist es höchste Zeit, diese Veränderungen in der Praxis zu sehen. Mal sehen, wie fotorealistisch, superduper und hochwertig dieses Tool ein halbes Jahr später ist.

Anwendungen von Midjourney v5

Lassen Sie mich gleich zur Sache kommen: Ich bin sprachlos. In meinem Artikel über Frankwatching Im September werden Sie Ergebnisse von Bildern sehen, die bei weitem nicht das sind, was derzeit möglich ist. Ja: Die Bilder damals waren fett, weil es noch nichts Besseres gab. Schon jetzt merke ich, wie schnell sich Dinge in kurzer Zeit ändern können. Hier sind also einige zufällig generierte Bilder und zugehörige Eingabeaufforderungen in Midjourney v5.

Mit Midjourney v5 generiertes Bild einer Frau in Yoga-Pose während der goldenen Stunde

(friedliche Yogaschule), (ruhig, heiter, spirituell, harmonisch), (Canon EOS R6), (Canon RF 24-105mm f/4L IS USM), (goldene Stunde), (offener Lebensstil), (Kodak Portra 400) –q 2 –v 5 –s 250

Quadriptychon-Malseite eines Bären, der ein Buch liest, das mit Midjourney v5 erstellt wurde

Realistische Malseite im Cartoon-Stil eines glücklichen und niedlichen Bären, der ein Buch im Wald liest, Nahaufnahme, Kopfschuss, dynamische Pose, Oberkörperporträt, Malseite für Kinder, Schwarzweiß, klare Linien, saubere und einfache Strichzeichnungen, weißer Hintergrund – ar v5 17:22

Bild eines Menschen im Dschungel, generiert mit dem KI-Tool Midjourney v5

„Schaffe ein Bild von einem Mann im Dschungel und konzentriere dich nur auf seinen Körper und die Umgebung. Der Mann sollte robuste Kleidung tragen und einen Rucksack oder andere Ausrüstung tragen. Er sollte inmitten eines dichten Dschungels positioniert werden, umgeben von hohen Bäumen und üppiger Vegetation. Die Beleuchtung sollte gedämpft sein und nur kleine Sonnenstrahlen durch das dichte Blätterdach darüber dringen. Der Körper des Mannes sollte sichtbar sein, aber sein Gesicht sollte verdeckt sein, entweder durch Schatten oder indem er seinen Kopf vom Betrachter abwendet. Die Gesamtstimmung des Bildes sollte abenteuerlich und mysteriös sein, mit einem Gefühl von Erforschung und Entdeckung v5.

Quadriptychon der Spieleinstellung mit von KI generiertem Dungeon

Spiel-Asset 16-Bit-Pixelkunst isometrisch, großer Dungeon, mit Details, Gegenständen und Wand, mittelalterliche Fantasie

So kann ich unendlich weitermachen. Ich schaue wieder mit der gleichen Begeisterung wie vor sechs Monaten auf das gestiegene Niveau von Midjourney. Die Bilder, die Sie hier sehen, wurden in wenigen Minuten erstellt. Das Einzige, was jetzt auffällt, ist der Zeh der Dame in Yoga-Pose. Es fühlt sich unnatürlich an. Aber weiter? Überzeugen Sie sich selbst von den Endergebnissen.

Midjourney v1 im Vergleich zu Midjourney v5

Um den Fortschritt von Midjourney noch besser zu zeigen, werde ich die Suchbegriffe, die ich vom September verwendet habe, erneut eingeben. Zuerst (links) poste ich das Bild, das Midjourney im September generiert hat. Dazu (rechts) stelle ich das beste Ergebnis von Midjourney 5. In diesem Fall sprechen Bilder mehr als tausend Worte.

Die Qualität der Bilder ist in sechs Monaten enorm gewachsen. Auf diesen Bildern sehe ich nur den Schriftsteller, der zwei Stifte hält und auf einem Laptop schreibt. Das fühlt sich nicht natürlich an. Aber wenn wir uns die Batman-Katze ansehen, ist das Endergebnis um ein Vielfaches besser als zuvor. Was denken Sie?

Bin ich immer noch der gleichen Meinung?

Vor einem halben Jahr sagte ich:

Midjourney ist ein wunderbares Werkzeug zum Erstellen von Konzepten. Designer können mit diesem Tool Skizzen erstellen und nach Belieben pimpen. Auf diese Weise erhalten Sie das Beste aus beiden Welten.

Und genau so sehe ich ein Tool wie Midjourney. Die Geschwindigkeit, mit der die Qualität dieser Tools steigt, ist erstaunlich. Ich kann mir nicht vorstellen, wie die Qualität in einem halben Jahr sein wird, aber das wird wahrscheinlich noch bizarrer.

Ich bin davon überzeugt, dass Midjourney und alle anderen KI-Tools wie ChatGPT brillante Tools sind, um die menschliche Effizienz zu steigern. Ein Computer drückt Ihre Idee aus und Sie erwecken diesen Ausdruck zum Leben. Wir sind in eine neue Ära eingetreten. KI ist da und wird bleiben.

Die Gefahren des Fotorealismus (Kontroverse)

Mit fortschrittlichen Tools wie Midjourney lauern auch Gefahren. Ich bin nicht der Erste, der ein Wort darüber sagt, aber bestimmt nicht der Letzte. Wenn jeder für fast nichts Zugang zu fotorealistischen Ausdrücken bekommt, dann wird es auch Leute mit schlechten Absichten geben.

Neem die umstrittene Nachricht über Donald Trump von letzter Woche. Es gab KI-generierte Bilder, die zeigten, wie Donald Trump von der New Yorker Polizei festgenommen wurde. Sehr gefälscht, aber in den falschen Händen ein mächtiges Werkzeug zur Verbreitung von Fake News. Werfen Sie selbst einen Blick auf die gefälschten Bilder, die die Runde gemacht haben:

Die Vorschriften hinken hinterher

Auch im September sprach ich bereits über die nachlaufenden Regelungen. Es gibt viel zu tun, sowohl im Bereich des Urheberrechts für die gemachten Äußerungen als auch bei der Verbreitung von Bildern, die auf Unwahrheiten beruhen. Anscheinend ist die Priorität der Regierung noch nicht hier.

Auf der Website der Nationalen Aufsichtsbehörde für digitale Infrastruktur des Ministeriums für Wirtschaft und Klima, überprüft am 22. März 2023, scheint es überhaupt keine Regelung über künstliche Intelligenz (KI) zu geben. Es heißt, dass sie damit beschäftigt sind, Änderungen und damit verbundene Risiken zu identifizieren. Wie lange dauert es, bis eine Rechnung dort ausgerollt wird? Joost sollte es wissen.

Abschluss

Tja, was soll man jetzt sagen. Das vergangene Jahr war fast überall von KI geprägt und das wird sich auch in naher Zukunft nicht ändern. Tools wie Midjourney werden in kurzer Zeit schneller und besser. Diese Daten sind da. KI ist da und KI wird bleiben. Sehen Sie diesen Artikel als einen guten Zeitpunkt, um darüber nachzudenken, ob Sie selbst etwas damit anfangen können. Die Welt verändert sich blitzschnell und ich bin gespannt, wie das in fünf Jahren sein wird. Stecken Sie im KI-Bereich mit an oder lassen Sie das komplett an sich vorbeiziehen? Es ist deine Entscheidung.


Source: Frankwatching by www.frankwatching.com.

*The article has been translated based on the content of Frankwatching by www.frankwatching.com. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!

*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.

*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!