👁️ Bilderkennung
Dieses Modul befähigt das Textverarbeitungssystem zur visuellen Analyse. Hochgeladene Bilder, Grafiken oder gescannte Dokumente werden ausgewertet, in Text konvertiert oder kontextbezogen beurteilt und verarbeitet.
Bereitstellung von Bilddaten
Die Übergabe der Dateien kann über drei Wege erfolgen:
- Drag & Drop: Dateien werden direkt in das Textfeld des Chats gezogen.
- Copy & Paste: Grafiken aus der Zwischenablage lassen sich per
Strg + V(bzw.Cmd + V) einfügen. - Manueller Upload: Ein Klick auf das Anhang-Symbol öffnet den System-Dialog zur Dateiauswahl.
Synergie von Bild und Prompt
Die höchste Effizienz wird erzielt, wenn das Bildmaterial direkt mit einer konkreten textlichen Arbeitsanweisung (Prompt) kombiniert übermittelt wird.
Anwendungsbeispiel Datenextraktion: Nach dem Upload eines abfotografierten Flipcharts lautet die Instruktion: "Bitte extrahieren Sie alle handschriftlichen Todos und strukturieren Sie diese als Markdown-Tabelle."
Erweiterte visuelle Verarbeitung
Für hochkomplexe Anwendungsfälle, bei denen Bilderkennung und Bildgenerierung nahtlos ineinandergreifen müssen (z. B. die Integration eines Design-Konzepts auf ein bestehendes Trägerobjekt), empfiehlt sich die Nutzung spezialisierter externer Modelle.
Ein detailliertes Praxisbeispiel für derartige kontextuelle Bildmanipulationen findet sich im Kapitel Drittanbieter-KI-Anbindung.
