Qualität
Das Ergebnis muss die Aufgabe fachlich angemessen, präzise und nachvollziehbar erfüllen.
Generative KI verändert nicht nur die Produktion von Texten, Analysen und Konzepten. Sie verändert auch, was als kompetentes Arbeiten gilt: Gute Ergebnisse müssen fachlich tragfähig, nachvollziehbar und ressourcenschonend entstehen.
Eine beaufsichtigte Prüfung mit kontrolliertem KI-Einsatz kann dabei als didaktische Brücke zur Bachelor- oder Masterarbeit verstanden werden. Unter fairen und vergleichbaren Bedingungen werden jene Kompetenzen sichtbar, die in unbeaufsichtigten Abschlussarbeiten besonders relevant sind: fachliche Urteilsfähigkeit, präzises Prompting, reflektierte KI-Nutzung und die Verantwortung für das eigene Ergebnis.
Das Ergebnis muss die Aufgabe fachlich angemessen, präzise und nachvollziehbar erfüllen.
Der Weg zum Ergebnis soll unnötige Tokens, Schleifen und Korrekturen vermeiden.
Der KI-Einsatz muss begründet, geprüft und fachlich verantwortet werden.
Bei generativer KI entstehen Kosten durch Tokens. Tokens sind die kleinsten Verarbeitungseinheiten, aus denen Eingaben, Kontext und Antworten bestehen. Wer lange, unklare oder wiederholte Prompts verwendet, erhöht den Ressourcenverbrauch.
Deshalb wird Prompting zu einer ökonomisch relevanten Kompetenz: In Studium und Beruf zählt nicht nur, ob ein Ergebnis erreicht wird, sondern auch, wie zielgerichtet und ressourcenschonend es entstanden ist.
Der interne Tokenverbrauch entsteht nicht nur durch den letzten Prompt. Relevant sind der eingegebene Kontext, der Gesprächsverlauf, die Länge der Antwort, die Modellwahl und die Zahl der notwendigen Korrekturschleifen.
Für eine faire Prüfung braucht es eine kontrollierte Arbeitsumgebung. Alle Prompts laufen über ein Tool, das Prompt, Antwort, Zeitpunkt, Modell, Tokenverbrauch, Kosten und Anzahl der Iterationen dokumentiert.
Dadurch wird der KI-gestützte Arbeitsprozess auswertbar. Nicht nur das Endprodukt liegt vor, sondern auch der Weg dorthin.
Ein kurzer Prompt ist nicht automatisch ein guter Prompt. Entscheidend ist das Verhältnis von Ergebnisqualität und Ressourcenaufwand. Ein effizientes Prompting führt mit möglichst wenig unnötigem Aufwand zu einem fachlich guten Ergebnis.
Ein spezialisiertes Bewertungsmodell kann den Thread anhand klarer Kriterien analysieren: Aufgabenbezug, fachliche Präzision, Redundanzvermeidung, sinnvolle Korrekturen, Reflexion und angemessener Tokenverbrauch.
In einer beaufsichtigten Prüfung ist die KI-Nutzung verpflichtender Bestandteil der Aufgabenbearbeitung. Studierende arbeiten in einer bereitgestellten Nutzeroberfläche, in der LLM, Werkzeuge und Parameter innerhalb definierter Rahmenbedingungen gewählt werden können.
Dadurch erhalten alle Teilnehmenden vergleichbare Voraussetzungen. Zugleich werden der vollständige Promptverlauf, die gewählten Einstellungen, die genutzten Werkzeuge, der Tokenverbrauch und weitere relevante Prozessdaten automatisch dokumentiert, mit abgegeben und KI-gestützt ausgewertet.
Das fachliche Ergebnis würde weiterhin durch die Prüfer*in bewertet. Die automatische KI-Auswertung könnte ergänzend analysieren, wie effizient, zielgerichtet und klug gepromptet wurde.
Dazu könnte der dokumentierte Promptverlauf mit einer Musterlösung, erwarteten Bearbeitungsschritten und definierten Bewertungskriterien verglichen werden. So ließe sich einschätzen, ob die Studierenden fachlich relevante Informationen gezielt genutzt, unnötige Schleifen vermieden und den Tokenverbrauch in ein angemessenes Verhältnis zur Ergebnisqualität gesetzt haben.
Das Tool verbindet technische Nutzungsdaten mit einer fachlichen Bewertung. Es zählt Tokens, berechnet Kosten, dokumentiert den Thread und lässt Ergebnis und Prompting-Prozess anhand einer Rubrik bewerten.
Damit Studierende solche Prüfungen bestehen und im Arbeitsleben souverän mit KI arbeiten können, muss Lehre stärker auf Aufgabenanalyse, fachliche Steuerung und KI-gestützte Prozessreflexion ausgerichtet werden.
Vor dem Prompt muss geklärt werden, was fachlich verlangt ist.
Ziel, Kontext, Kriterien, Format und Grenzen müssen präzise formuliert werden.
KI-Ergebnisse müssen fachlich geprüft und begründet verbessert werden.
Studierende lernen, Tokenverbrauch und Modellwahl mitzudenken.
Diese Prüfungsform stärkt Fachlichkeit, weil gute Prompts ein gutes Aufgabenverständnis voraussetzen. Wer den Gegenstand kennt, fragt präziser, erkennt Fehler schneller und vermeidet unnötige Schleifen.
Gleichzeitig wird der Arbeitsprozess transparent. Bewertet wird nicht nur ein fertiges Produkt, sondern auch die Fähigkeit, KI fachlich, effizient und verantwortungsvoll zu steuern.
Eine solche Didaktik bereitet auf Arbeitskontexte vor, in denen KI-Nutzung nach Qualität, Effizienz und Kostenbewusstsein beurteilt wird. Hochschulen können damit Prüfungsformate entwickeln, die KI nicht ausblenden, sondern kompetenten KI-Einsatz sichtbar, bewertbar und lernbar machen.