Prompting & Prüfung

Effektives Prompting als neue Prüfungs- und Handlungskompetenz

Generative KI verändert nicht nur die Produktion von Texten, Analysen und Konzepten. Sie verändert auch, was als kompetentes Arbeiten gilt: Gute Ergebnisse müssen fachlich tragfähig, nachvollziehbar und ressourcenschonend entstehen.

Eine beaufsichtigte Prüfung mit kontrolliertem KI-Einsatz kann dabei als didaktische Brücke zur Bachelor- oder Masterarbeit verstanden werden. Unter fairen und vergleichbaren Bedingungen werden jene Kompetenzen sichtbar, die in unbeaufsichtigten Abschlussarbeiten besonders relevant sind: fachliche Urteilsfähigkeit, präzises Prompting, reflektierte KI-Nutzung und die Verantwortung für das eigene Ergebnis.

Qualität

Das Ergebnis muss die Aufgabe fachlich angemessen, präzise und nachvollziehbar erfüllen.

Effizienz

Der Weg zum Ergebnis soll unnötige Tokens, Schleifen und Korrekturen vermeiden.

Reflexion

Der KI-Einsatz muss begründet, geprüft und fachlich verantwortet werden.

Ausgangspunkt

KI-Nutzung ist nicht kostenlos.

Bei generativer KI entstehen Kosten durch Tokens. Tokens sind die kleinsten Verarbeitungseinheiten, aus denen Eingaben, Kontext und Antworten bestehen. Wer lange, unklare oder wiederholte Prompts verwendet, erhöht den Ressourcenverbrauch.

Deshalb wird Prompting zu einer ökonomisch relevanten Kompetenz: In Studium und Beruf zählt nicht nur, ob ein Ergebnis erreicht wird, sondern auch, wie zielgerichtet und ressourcenschonend es entstanden ist.

                        Kernidee: Gute KI-Nutzung verbindet Fachkenntnis, präzise Steuerung und Kostenbewusstsein.
                    

Tokenverbrauch

Wovon hängt der Verbrauch ab?

Der interne Tokenverbrauch entsteht nicht nur durch den letzten Prompt. Relevant sind der eingegebene Kontext, der Gesprächsverlauf, die Länge der Antwort, die Modellwahl und die Zahl der notwendigen Korrekturschleifen.

Input Prompt, Quellen, Beispiele und mitgesendeter Verlauf.

Output Länge, Detailgrad und Format der KI-Antwort.

Iteration Rückfragen, Fehlversuche und Nachbesserungen.

Modellwahl Komplexe Modelle sind nicht für jede Aufgabe nötig.

Messung

Tokenverbrauch muss sichtbar werden.

Für eine faire Prüfung braucht es eine kontrollierte Arbeitsumgebung. Alle Prompts laufen über ein Tool, das Prompt, Antwort, Zeitpunkt, Modell, Tokenverbrauch, Kosten und Anzahl der Iterationen dokumentiert.

Dadurch wird der KI-gestützte Arbeitsprozess auswertbar. Nicht nur das Endprodukt liegt vor, sondern auch der Weg dorthin.

Messdaten:
Input Tokens + Output Tokens + Iterationen + Modellkosten + Bearbeitungszeit + finaler Output + vollständiger Thread

Bewertung

Effizienz ohne Qualität reicht nicht.

Ein kurzer Prompt ist nicht automatisch ein guter Prompt. Entscheidend ist das Verhältnis von Ergebnisqualität und Ressourcenaufwand. Ein effizientes Prompting führt mit möglichst wenig unnötigem Aufwand zu einem fachlich guten Ergebnis.

Bewertungslogik:
Prompting-Kompetenz = Ergebnisqualität + Prozessqualität + Ressourceneffizienz

Ein spezialisiertes Bewertungsmodell kann den Thread anhand klarer Kriterien analysieren: Aufgabenbezug, fachliche Präzision, Redundanzvermeidung, sinnvolle Korrekturen, Reflexion und angemessener Tokenverbrauch.

Prüfung

Geprüft wird Ergebnis und Arbeitsweg.

In einer beaufsichtigten Prüfung ist die KI-Nutzung verpflichtender Bestandteil der Aufgabenbearbeitung. Studierende arbeiten in einer bereitgestellten Nutzeroberfläche, in der LLM, Werkzeuge und Parameter innerhalb definierter Rahmenbedingungen gewählt werden können.

Dadurch erhalten alle Teilnehmenden vergleichbare Voraussetzungen. Zugleich werden der vollständige Promptverlauf, die gewählten Einstellungen, die genutzten Werkzeuge, der Tokenverbrauch und weitere relevante Prozessdaten automatisch dokumentiert, mit abgegeben und KI-gestützt ausgewertet.

Bewertungsvorschlag

Das fachliche Ergebnis würde weiterhin durch die Prüfer*in bewertet. Die automatische KI-Auswertung könnte ergänzend analysieren, wie effizient, zielgerichtet und klug gepromptet wurde.

Dazu könnte der dokumentierte Promptverlauf mit einer Musterlösung, erwarteten Bearbeitungsschritten und definierten Bewertungskriterien verglichen werden. So ließe sich einschätzen, ob die Studierenden fachlich relevante Informationen gezielt genutzt, unnötige Schleifen vermieden und den Tokenverbrauch in ein angemessenes Verhältnis zur Ergebnisqualität gesetzt haben.

Tool-Konzept

Ein Tool bewertet Prompting-Prozesse.

Das Tool verbindet technische Nutzungsdaten mit einer fachlichen Bewertung. Es zählt Tokens, berechnet Kosten, dokumentiert den Thread und lässt Ergebnis und Prompting-Prozess anhand einer Rubrik bewerten.

1. Erfassen Alle Prompts und Antworten werden vollständig gespeichert.

2. Messen Tokenverbrauch, Kosten, Iterationen und Modellwahl werden ausgewertet.

3. Bewerten Ergebnis und Prozess werden anhand einer Rubrik analysiert.

4. Rückmelden Studierende erhalten Feedback zu Qualität, Effizienz und Reflexion.

Lehre

Studierende brauchen neue Kompetenzen.

Damit Studierende solche Prüfungen bestehen und im Arbeitsleben souverän mit KI arbeiten können, muss Lehre stärker auf Aufgabenanalyse, fachliche Steuerung und KI-gestützte Prozessreflexion ausgerichtet werden.

Aufgabenanalyse

Vor dem Prompt muss geklärt werden, was fachlich verlangt ist.

Prompt-Strategien

Ziel, Kontext, Kriterien, Format und Grenzen müssen präzise formuliert werden.

Qualitätskontrolle

KI-Ergebnisse müssen fachlich geprüft und begründet verbessert werden.

Ressourcenbewusstsein

Studierende lernen, Tokenverbrauch und Modellwahl mitzudenken.

Didaktischer Mehrwert

Sachkenntnis lohnt sich wieder sichtbar.

Diese Prüfungsform stärkt Fachlichkeit, weil gute Prompts ein gutes Aufgabenverständnis voraussetzen. Wer den Gegenstand kennt, fragt präziser, erkennt Fehler schneller und vermeidet unnötige Schleifen.

Gleichzeitig wird der Arbeitsprozess transparent. Bewertet wird nicht nur ein fertiges Produkt, sondern auch die Fähigkeit, KI fachlich, effizient und verantwortungsvoll zu steuern.

                        Das verschiebt KI-Prüfungen weg von der Frage „Wurde KI genutzt?“ hin zur Frage „Wie kompetent wurde KI genutzt?“
                    

Perspektive

Eine solche Didaktik bereitet auf Arbeitskontexte vor, in denen KI-Nutzung nach Qualität, Effizienz und Kostenbewusstsein beurteilt wird. Hochschulen können damit Prüfungsformate entwickeln, die KI nicht ausblenden, sondern kompetenten KI-Einsatz sichtbar, bewertbar und lernbar machen.

Zurück zur Startseite Interesse am Austausch