Zum Hauptinhalt springen

👁️ Bilderkennung

Dieses Modul befähigt das Textverarbeitungssystem zur visuellen Analyse. Hochgeladene Bilder, Grafiken oder gescannte Dokumente werden ausgewertet, in Text konvertiert oder kontextbezogen beurteilt und verarbeitet.

Bereitstellung von Bilddaten

Die Übergabe der Dateien kann über drei Wege erfolgen:

  • Drag & Drop: Dateien werden direkt in das Textfeld des Chats gezogen.
  • Copy & Paste: Grafiken aus der Zwischenablage lassen sich per Strg + V (bzw. Cmd + V) einfügen.
  • Manueller Upload: Ein Klick auf das Anhang-Symbol öffnet den System-Dialog zur Dateiauswahl.

Synergie von Bild und Prompt

Die höchste Effizienz wird erzielt, wenn das Bildmaterial direkt mit einer konkreten textlichen Arbeitsanweisung (Prompt) kombiniert übermittelt wird.

Bild-Upload mit Textanweisung

Die parallele Übergabe fokussiert die Analyse auf relevante Bildelemente.


Erweiterte visuelle Verarbeitung

Für hochkomplexe Anwendungsfälle, bei denen Bilderkennung und Bildgenerierung nahtlos ineinandergreifen müssen (z. B. die Integration eines Design-Konzepts auf ein bestehendes Trägerobjekt), empfiehlt sich die Nutzung spezialisierter externer Modelle.

Ein detailliertes Praxisbeispiel für derartige kontextuelle Bildmanipulationen findet sich im Kapitel Drittanbieter-KI-Anbindung.