Mit KI selbst erstellte (String-) Bilder
Verfasst: Mo 4. Aug 2025, 20:05
Ich spiele gerade etwas mit der Bildgenerierung durch Grok (auf "X").
Ich bin einerseits fasziniert von der oft realistischen und detailgetreuen Darstellung, andererseits verzweifle ich manchmal an den Ergebnissen.
Da werden teilweise Anweisungen nicht umgesetzt (z. B. Person A soll Person B zuwinken oder ihr etwas überreichen) oder sie führen zu überraschendem "Eigenleben" (z. B. winkt auf einmal Person B zurück). Manche "Regieanweisungen" werden missachtet oder falsch interpretiert, z. B. sollen die Personen vollständig abgebildet werden (und nicht nur bis zu den Schultern) oder Person A soll hinter Person B gehen (ist dann aber im Bild vor dieser Person). Und natürlich auch groteske Verzerrungen oder sinnlose Darstellungen (z. B. ein in sich verdrehter Körper oder jemand, der bäuchlings im flachen Wasser liegt und ein Buch liest, während die Aufforderung war, die Person im Sand, entfernt vom Wasser, liegen zu lassen).
Interessant: Bestimmte Bildelemente sind während des Experimentierens relativ statisch (z. B. die Frisur), manche variieren (z. B. ist die Statur oft schlank, dann aber mal etwas stämmiger oder die Bekleidung, hier der Badestring, wechselt einmal von knapp zu moderat oder von "ausgefüllt" zu "Delta"). Umgebende Personen, sofern in der Beschreibung erwähnt, orientieren sich manchmal an den "Hauptfiguren", z. B. trägt eine andere Frau ebenfalls einen weißen Bikini oder ein anderer Mann trägt einen ("echten") Tanga, obwohl "herkömmliche" oder "übliche" Badebekleidung vorgegeben war.
Manchmal scheitern die Bilder an der eingebauten Zensur, weil sie wohl zu "heiß" generiert wurden, und werden dann ausgeblendet.
Die Bilder wurden mit folgendem Prompt generiert:
Erstelle ein Bild mit realistischer Darstellung. Ein Mann und eine Frau gehen am Strand parallel der Wasserlinie entlang. Sie sind von hinten zu sehen. Sie sind beide jung, schlank, attraktiv. Er hat blonde, mittellange Haare. Sie hat braune lange Haare. Er hat seine sonstige Körperbehaarung entfernen lassen. Auf ihren sonnengebräunten Körpern glitzern etliche Wassertropfen. An ihren Waden klebt etwas Sand. Er trägt einen sehr knappen schwarzen Thong. Sie trägt einen sehr knappen weißen Thong (G-String). Am Strand befinden sich einige weitere Personen in klassischer Badebekleidung (Badeanzug, Bikini, Shorts oder Speedo). Sie baden im Wasser oder spielen am Strand.
Warum "Thong" und nicht "Badestring" oder "String"? Hier scheint die "Muttersprache" von Grok durchzuschlagen und zaubert dann z. B. Schnüre über die Pobacken oder die Schultern.
Ich bin einerseits fasziniert von der oft realistischen und detailgetreuen Darstellung, andererseits verzweifle ich manchmal an den Ergebnissen.
Da werden teilweise Anweisungen nicht umgesetzt (z. B. Person A soll Person B zuwinken oder ihr etwas überreichen) oder sie führen zu überraschendem "Eigenleben" (z. B. winkt auf einmal Person B zurück). Manche "Regieanweisungen" werden missachtet oder falsch interpretiert, z. B. sollen die Personen vollständig abgebildet werden (und nicht nur bis zu den Schultern) oder Person A soll hinter Person B gehen (ist dann aber im Bild vor dieser Person). Und natürlich auch groteske Verzerrungen oder sinnlose Darstellungen (z. B. ein in sich verdrehter Körper oder jemand, der bäuchlings im flachen Wasser liegt und ein Buch liest, während die Aufforderung war, die Person im Sand, entfernt vom Wasser, liegen zu lassen).
Interessant: Bestimmte Bildelemente sind während des Experimentierens relativ statisch (z. B. die Frisur), manche variieren (z. B. ist die Statur oft schlank, dann aber mal etwas stämmiger oder die Bekleidung, hier der Badestring, wechselt einmal von knapp zu moderat oder von "ausgefüllt" zu "Delta"). Umgebende Personen, sofern in der Beschreibung erwähnt, orientieren sich manchmal an den "Hauptfiguren", z. B. trägt eine andere Frau ebenfalls einen weißen Bikini oder ein anderer Mann trägt einen ("echten") Tanga, obwohl "herkömmliche" oder "übliche" Badebekleidung vorgegeben war.
Manchmal scheitern die Bilder an der eingebauten Zensur, weil sie wohl zu "heiß" generiert wurden, und werden dann ausgeblendet.
Die Bilder wurden mit folgendem Prompt generiert:
Erstelle ein Bild mit realistischer Darstellung. Ein Mann und eine Frau gehen am Strand parallel der Wasserlinie entlang. Sie sind von hinten zu sehen. Sie sind beide jung, schlank, attraktiv. Er hat blonde, mittellange Haare. Sie hat braune lange Haare. Er hat seine sonstige Körperbehaarung entfernen lassen. Auf ihren sonnengebräunten Körpern glitzern etliche Wassertropfen. An ihren Waden klebt etwas Sand. Er trägt einen sehr knappen schwarzen Thong. Sie trägt einen sehr knappen weißen Thong (G-String). Am Strand befinden sich einige weitere Personen in klassischer Badebekleidung (Badeanzug, Bikini, Shorts oder Speedo). Sie baden im Wasser oder spielen am Strand.
Warum "Thong" und nicht "Badestring" oder "String"? Hier scheint die "Muttersprache" von Grok durchzuschlagen und zaubert dann z. B. Schnüre über die Pobacken oder die Schultern.