Programme mit Künstlicher Intelligenz (KI) können mittlerweile Bilder erzeugen, die von menschengemachten Fotos, Bilder, Grafiken etc. oft nicht mehr zu unterscheiden sind.
Nun fehlen mir bei vielen Burgen noch wirklich gute Fotos.
Da, dachte ich, ich lasse mir von der KI mal ein paar Burgen-Ansichten generieren. KI-Bilder aus Text. Ganz einfach.
Weil das erstellen so schön klappt, habe ich mir die Anlagen als KI-Bilder in Wasserfarben malen lassen. Mit der Kaiserburg über Nürnberg habe ich angefangen.
Benutzt habe ich dafür die vor einigen Wochen noch kostenfreie Version von Stable Diffusion. Inzwischen kostet die Nutzung 7 bis 10 Euro pro Monat.
Meine Erfahrungen mit KI-Burgenbildern
Erstmal die positiven Eindrücke:
- Herausgekommen sind fast durchweg sehr ästhetische KI-Bilder.
- Das Berechnen der Bilder dauert in der Regel weniger als eine Minute. Die Anwendung ist denkbar einfach.
- Durch die schnellen Erfolge macht es Spaß
- Wenn ein Bild nicht gefällt, generiert man halt ein anderes
- Vordergrund und Hintergrund geben den Burgen-Bildern oft Tiefe. Das Auge wandert gern hin und her.
- Die Farben sind ansprechend, gerade bei süddeutschen Sandstein-Burgen. Die Wärme des Mauerwerks kommt gut rüber.
- Die KI greift bei vielen, speziell bei im Web bekannten Burgen auf reale Bilder zurück. Das heißt, die KI-Burgen sehen ihren realen Vorbildern inzwischen in vielen Fällen zumindest ähnlich.
- Die KI kann sehr detailverliebt sein: Hier ein extra-Türmchen, dort ein Erker, und noch ein paar Mauern und noch eine Vorburg sind häufig als Zugabe drin. Am Ende sieht die Wasserfarben-Burg dadurch oft wesentlich pitoresker aus als das Original
- Es werden auch „Zeitreisen“ möglich. Man kann der KI Befehle (Prompts) geben wie „Zeige die Burg um 1520“. Was dann herauskommt, ist natürlich sehr unterschiedlich.
- Die vielen Filter, die so eine KI bietet („Generiere das Bild im Stil X“) eröffnen erstaunliche Möglichkeiten. Ich bin ganz begeistert vom „Metropolis“-Filter für KI-Bilder bei Stable Diffusion.
Negative Anmerkungen
Natürlich habe ich auch etwas zu meckern:
- Das Ergebnis von KI-Burgen-Bildern – so täuschend echt es auch ausschauen mag – ist immer fiktiv. Das ist natürlich völlig klar, weil die KI ja in X-tausend Schritten Elemente aus ihrer Datenbank neu zusammensetzt.
- Das ständige Hinzufügen von Türmchen und Schmuckelementen kann schnell nerven
- Wenn man sich per Prompt Menschen dazu wünscht, stimmt häufig die Zahl der Finger oder der Beine nicht
- Wenn man sich Menschen dazu wünscht, die die Burg mit dem Smartphone fotografieren, passt das Bild auf dem Smartphone-Display nicht zur dargestellten Burg (siehe oben).
- Die KI ist nicht zu kleineren Korrekturen in der Lage („lass mal den Turm links weg“ geht nicht). Jedes Bild ist ein Unikat.
- Die KI-Bildqualität lässt sich nicht mehr verbessern. Ein Erhöhen der Auflösung ist leider nicht möglich. KI-Bilder Schärfen ist nur sehr begrenzt möglich.
- Die einzige deutsche Burg, die die KI nach meinem Eindruck wirklich gut wiedergeben kann, ist Schloss Neuschwanstein
KI oder keine KI?
Also. KI-Bilder mit Bezug zu Burgen und Schlössern sehen sehr häufig sehr genial aus. Das ist aber auch ihr Nachteil. Sie zeigen häufig ein irreal weichgezeichnetes Zuckerbäckerbild. Prima für Märchen, Sagen, historischen Rückblicken und so weiter.
Mir macht es sehr viel Spaß mit KI-Bildern herumzuprobieren. Endlich lassen sich Burgen-Sagen bebildern. Und Vorschaubilder für Social-Media-Kanäle wirken mit KI-Input auch um vieles lebendiger.
Für dokumentarische Zwecke eignen sich die kostenlos nutzbare KI leider nicht. Ich werde diese grandiosen Möglichkeiten weiter nutzen. Dabei setze ich aber vor allem auf Illustrationen und nicht auf fotorealistische Bilder, um keine Verwechselungen aufkommen zu lassen.
Das Thema „versunkene Burgen“ lässt sich mit KI-Bildern gut illustrieren (Link zu meinem Blogartikel dazu), wenn man „nur“ über Sagen über verschwundene Burgen berichtet.
Die generierten Bilder sollten halt keinen direkten Realitätsbezug mit möglicherweise nicht korrekten historischen Details haben.
Links zum Thema KI-Bilder:
Link zum open source „Deep-Learning-Text-zu-Bild-Generator“ Stable Diffusion.
Wie funktionert Stable Diffusion? Wie entstehen solche KI-Bilder? Das wird in einem eigenen Wikipedia-Artikel erklärt. Ich übernehme allerdings keine Garantie, dass man es nach dem Lesen verstanden hat.
Ein Beispiel für KI-Bilder hier im Blogartikel „Blutflecken auf Burgen„.
Markus Schwarze schreibt in der Online-Ausgabe der FAZ unter der Überschrift „Prompt der Woche: Wie die KI lernt, Bilder zu lesen“ (von November 2023. Link zum Artikel)
Pingback: Wenn KI Bilder von Burgen generiert – Archivalia
Interessante Ergebnisse. Immerhin muss man sich bei KI-Burgen nicht mit stürzenden Linien herumschlagen. Aber egal wie gut die Bilder sind, man erkennt doch auf den ersten Blick, dass sie KI-generiert sind. Gut so. Dann ist jedenfalls klar, dass das keine echten Fotos sind.