Was bedeutet ChatGPT für die Gestaltung von Prüfungen an Hochschulen?

3.Februar 2023

Die Veröffentlichung von ChatGPT erzeugt Unruhe in der Hochschulwelt. Von einem Tag auf den Nächsten wird eine etablierte kulturelle Praktik ad absurdum geführt. Hausarbeiten, Essays, Case Studies oder Abschlussarbeiten scheinen nicht mehr geeignet, den Kompetenzerwerb zu messen.

Die disruptiven Veränderungen deuten sich schon länger an. Als Hochschulen müssen wir uns hier positionieren und die Konsequenzen für Curricula und Prüfungen ernst nehmen. Wir sollten uns aber auch die Zeit für eine fundierte Diskussion lassen.

Hochschulen werden die Nutzung von KI langfristig nicht verbieten können.

Die Herausforderung ist klar: Ein Verbot, KI zu nutzen, wird sich nicht durchsetzen lassen. Es gibt erste Versuche, über eine Analyse von Sprachmustern zu identifizieren, ob ein Text von einer KI geschrieben wurde oder nicht. Und dann? Führt eine Prüfungsleistung, bei der eine KI eine über 90%-Wahrscheinlichkeit identifiziert hat, dass eine KI bei der Erstellung mitgewirkt hat, zu einer schlechteren Bewertung?

Außerdem sind die Kriterien unklar, die wir für die Bewertung von verfügbaren KI-Tools nutzen.

Zwei Beispiele:

Das Angebot languagetool.org bietet eine Grammatik-, Stil- und Rechtschreibprüfung an, die sich in Browser, E-Mail-Programme und Textverarbeitungsprogramme integrieren lässt. Das Tool korrigiert nicht nur Fehler, sondern unterstützt auch bei der Überarbeitung von Formulierungen und weist auf stilistische Verbesserungen.
Die Plattform Deepl.com ermöglicht das Übersetzen von Texten. Ich bin immer wieder verblüfft, wie gut die Übersetzungen sind. Durch die Option, mit einem individuellen Glossar, dem Tool „Fachbegriffe“ beizubringen, eignet sich das Tool auch für die Unterstützung bei der Übersetzung von Fachtexten.

Technologisch basieren beide Tools auf komplexen Sprachmodellen, aus denen Entscheidungen abgeleitet werden können. Der Schritt zu Deepl-Write, dem KI-Schreibassistent von Deepl scheint deshalb nicht sehr groß zu ein.

Wie sollen wir den „Grad der Intelligenz“ eines Tools bewerten? Ist eine KI, die meinen Text überarbeitet „verbotener“, als eine KI, die mir einen Text vorschlägt, den ich überarbeite? Wie intelligent muss ein Tool sein, damit es verboten wird? Und gibt es irgendwann eine ständig gepflegte Black-List, mit verbotenen Tools?

Notwendig sind klare Regeln zu Nutzung künstlicher Intelligenz für die Erstellung von schriftlichen Arbeiten.

In den meisten Prüfungsordnungen gibt es klare Regeln zu Hilfsmitteln, die in Prüfungen genutzt werden dürfen. Oft gilt: Die Hilfsmittel werden für jede Prüfung explizit genannt. Diese Regeln sollten für Studierende nicht nur transparent, sondern vor allem auch nachvollziehbar begründet sein. Und das bedeutet immer: Vom Lernziel her begründet sein.

Statt einem generellen Verbot plädiere ich für eine differenzierte Regelung. Das kann bedeuten, dass wir in manchen Fällen wieder einen Schritt zurück machen müssen und Prüfungsformen anpassen. Das kann auch zu vermeintlichen „old school“ Prüfungen-Formen führen, die ggf. sogar ohne digital Werkzeuge auskommen müssen.

Wenn z.B. die Kompetenz gemessen werden soll, eine empirische überprüfbare Hypothese auszustellen und ein passendes Forschungsdesign abzuleiten – kann eine Prüfung ohne Hilfsmittel sinnvoll sein. Wenn es darum geht, grundlegende Konzepte objektorientierter Programmiersprachen zu verstehen, kann das eigenständige Tippen von Code „von der ersten Zeile an eine passende Messmethode sein.

Eine weitere Perspektive: Damit eine Prüfungsleistung eine zuverlässige Vorhersage der späteren Leistung im Beruf ist, sollten sich die Aufgaben (also Prüfungsaufgabe und Arbeitsaufgabe) ähnlich sein. Bei Regelungen zu ChatGPT sollten wir deshalb auch berücksichtigen, wie die spätere Berufspraxis aussieht, auf die wir unserer Studierenden vorbereiten. Ich gehe davon aus, dass KI-Tools integraler Bestandteil für wissensbezogene Tätigkeiten sein werden – und jetzt schon in vielen Fällen sind.

Konsequent ist deshalb, Aufgabenstellungen und Rahmenbedingungen praxisnah zu gestalten. Das bedeutet, bei der Gestaltung von Prüfungen, die gesellschaftliche Realität zu berücksichtigen, zu denen auch sich ständig weiterentwickelnde KI-Tools gehören.

Welche Funktion hat eine schriftliche Arbeit im Rahmen des Studiums?

Außerdem ist es notwendig zu klären, welche Funktion eine schriftliche Arbeit im Rahmen des Studiums hat. Anders formuliert: Welche Kompetenz soll mit einer schriftlichen Prüfungsleistung wie einer Hausarbeit gemessen werden?

Geht es darum, Regeln, soziale Praktiken und Fachstandards zu kennen und sich daran zu halten?
Möchten wir mit einer schriftlichen Arbeit, die vertiefte Auseinandersetzung mit einem Thema anregen?
Messen wir die Kompetenz, ein Problem mit wissenschaftlichen Methoden zu bearbeiten und Lösungen zu entwickeln?

Die technologischen Veränderungen können ein Anlass sein, über die Prüfungskultur nachzudenken und darüber, welche didaktische Funktion Prüfungsleistungen haben.

Ich kenne das Schreiben von Texten aus dem eigenen Studium – und hatte in den höheren Semestern meistens auch Spaß daran.
Ich verstehe das Schreiben von Texten als wichtige Kulturtechnik, die mir hilft, Argumente und Meinungen zu präzisieren.
Ich nehme schriftliche Texte als zentrales Instrument für den Erkenntnisgewinn innerhalb der Wissenschaft wahr.

Sich in der schriftlichen Kommunikation kompetent und verständlich auszudrücken, ist eine zentrale und für den beruflichen Erfolg sehr wichtige Kompetenz. Vielen Entscheider*innen in den Hochschulen wird es ähnlich gehen – trotzdem ist die eigene Haltung zu schriftlichen Texten keine didaktisch fundierte Argumentation zum Sinn und Nutzen von schriftlichen Texten.

Das Konzept Constructive Alignment verändert die Sicht auf die Konzeption von Lehre.

Die von John Biggs eingeführte Idee des Constructive Alignment kann ein hilfreiches Konzept sein.

Die Grundidee: Am Anfang der Konzeption von Lehre müssen die Lernziele (nicht die Lerninhalte) stehen, die erreicht werden sollen. Das ist auf den ersten Blick eine sprachliche Spitzfindigkeit. John Biggs ist hier aber von einer konstruktivistischen Denkweise geprägt. In diesem Verständnis ist Lernen nur dann möglich, wenn neue Lerninhalte (Ideen, Konzepte, Theorien) mit dem Erfahrungshintergrund der Lernenden vernetzt werden. Nur die Lerninhalte, die Lernenden auf echte oder zukünftige Erfahrungen anwenden können, werden Teil des eigenen Wissens.

Erst wenn klar ist, was Studierende im späteren Beruf können sollten, kann ein Lernziel formuliert werden. Im nächsten Schritt kann eine Prüfungsform festgelegt werden, die das Erreichen dieser Lernziele prüft.

Erst dann startet die Konzeption eines Lernangebotes und es werden die Lerninhalte und die Prüfungsform festgelegt. Das werden alle Lehrenden bestätigen können: Die Prüfungsform beeinflusst das Verhalten von Studierenden.

Constructive Alignment bedeutet deshalb auch, die Lehre von der Prüfung her zu denken.

Bevor wir also über die Zulassung von Large Language Models (wie z.B. ChatGPT) als Hilfsmittel für das Erstellen von schriftlichen Texten in Prüfungen diskutieren, sollen wir über die Lernziele nachdenken, um die es uns geht.

Die zielführende Nutzung von KI-Tools ist eine wichtige Kompetenz für die Zukunft

Es wäre falsch, alle technologischen Möglichkeiten und die verfügbaren KI-Tools unreflektiert zu nutzen. Wir haben als Hochschulen die Verantwortung, unsere Studierenden zu kompetenten Bürgerinnen und Bürger einer Wissensgesellschaft zu machen. Das bedeutet mindestens, sie bei der Entwicklung notwendiger Kompetenzen zu unterstützen, den Raum für kritische Auseinandersetzung mit technologischen Trends zu bieten und den Einsatz digitaler Tools einzuüben. Dazu müssen wir unsere Curricula (und unsere Prüfungsordnungen) an die digitale Wirklichkeit anpassen.

Ein großer Schritt nach vorne ist es, Prüfungen nicht als eine etablierte kulturelle Praktik zu verstehen, deren Form und Bedeutung unantastbar ist, sondern die Messung von Kompetenzen den didaktischen Zielen unterzuordnen. Erst wenn wir wissen, welche Funktion eine Prüfung hat, können wir fundiert entscheiden, ob das Prüfungsformat passend ist, welche Alternativen es gibt und welche Regelungen zur Nutzung von KI notwendig sind.

KI-Disclaimer: Dieser Text wurde ohne den Einsatz von KI geschrieben. Ich habe languagetool.org für die Rechtschreibprüfung verwendet. Der Text ist in englischer Sprache bereits auf medium.com erschienen.

By moskaliuk

Schreibe einen Kommentar Antworten abbrechen

Comments RSS Feed

Prof. Dr. Johannes MoskaliukDiplompsychologe, Wissenschaftler, Business-Coach