👁️ Bilderkennung

Dieses Modul befähigt das Textverarbeitungssystem zur visuellen Analyse. Hochgeladene Bilder, Grafiken oder gescannte Dokumente werden ausgewertet, in Text konvertiert oder kontextbezogen beurteilt und verarbeitet.

Bereitstellung von Bilddaten

Die Übergabe der Dateien kann über drei Wege erfolgen:

Drag & Drop: Dateien werden direkt in das Textfeld des Chats gezogen.
Copy & Paste: Grafiken aus der Zwischenablage lassen sich per Strg + V (bzw. Cmd + V) einfügen.
Manueller Upload: Ein Klick auf das Anhang-Symbol öffnet den System-Dialog zur Dateiauswahl.

Synergie von Bild und Prompt

Die höchste Effizienz wird erzielt, wenn das Bildmaterial direkt mit einer konkreten textlichen Arbeitsanweisung (Prompt) kombiniert übermittelt wird.

Bild-Upload mit Textanweisung — Die parallele Übergabe fokussiert die Analyse auf relevante Bildelemente.

Anwendungsbeispiel Datenextraktion: Nach dem Upload eines abfotografierten Flipcharts lautet die Instruktion: "Bitte extrahieren Sie alle handschriftlichen Todos und strukturieren Sie diese als Markdown-Tabelle."

Erweiterte visuelle Verarbeitung

Für hochkomplexe Anwendungsfälle, bei denen Bilderkennung und Bildgenerierung nahtlos ineinandergreifen müssen (z. B. die Integration eines Design-Konzepts auf ein bestehendes Trägerobjekt), empfiehlt sich die Nutzung spezialisierter externer Modelle.

Ein detailliertes Praxisbeispiel für derartige kontextuelle Bildmanipulationen findet sich im Kapitel Drittanbieter-KI-Anbindung.

Bereitstellung von Bilddaten​

Synergie von Bild und Prompt​

Erweiterte visuelle Verarbeitung​

Bereitstellung von Bilddaten

Synergie von Bild und Prompt

Erweiterte visuelle Verarbeitung