Besteht ChatGPT die ISTQB Foundation Level Prüfung?

🕒 Lesedauer: 7 Minuten

KI und die Zukunft der Softwaretest-Zertifizierungen

In der Welt der Softwareentwicklung ist die Zertifizierung ein kritischer Schritt für Fachleute, die ihre Fähigkeiten validieren und ihre Karrierechancen verbessern wollen. Der ISTQB Foundation Level ist eine solche Zertifizierung, die von Softwaretestern weltweit angestrebt wird, um ihr grundlegendes Verständnis und ihre Kompetenz in diesem Bereich nachzuweisen. In jüngster Zeit haben technologische Fortschritte, insbesondere im Bereich der Künstlichen Intelligenz, neue Methoden für das Lernen und die Prüfungsvorbereitung hervorgebracht. Large Language Models (LLMs) wie ChatGPT spielen dabei eine immer wichtigere Rolle. Diese Modelle unterstützen nicht nur das Lernen durch die Bereitstellung von Informationen und Erklärungen, sondern könnten auch die Art und Weise, wie wir Wissen bewerten und Zertifizierungen durchführen, grundlegend verändern.

Dieser Artikel untersucht den Einsatz von ChatGPT für eine ISTQB Foundation Level Prüfung und bewertet dessen Potentiale und Grenzen. Indem wir ChatGPT mit Prüfungsfragen konfrontieren und die Antworten analysieren, diskutieren wir nicht nur die Fähigkeit des Modells, präzise Antworten zu liefern, sondern auch die tieferen Implikationen des Einsatzes solch fortschrittlicher Technologien im Bereich des Lernens und der Zertifizierung. Insbesondere stellen wir die Frage nach der Authentizität der Prüfungsergebnisse und diskutieren, ob und wie der Prüfungsprozess angepasst werden muss, um in einer Ära zunehmender Digitalisierung relevant und effektiv zu bleiben.

Wir unterstützen Sie in Ihrer ISTQB Zertifizierung: Melden Sie sich jetzt für die ISTQB Certified Tester Foundation Level 4.0 Schulung & Prüfung an! 

 

 

1. Hintergrund

1.1 ISTQB Foundation Level – Ein Überblick

Das International Software Testing Qualifications Board (ISTQB) hat sich seit seiner Gründung im Jahr 2002 als führende Instanz für die Zertifizierung von Fachkenntnissen im Bereich Software-Testen etabliert. Der ISTQB Foundation Level (FL) ist die Einstiegszertifizierung, die ein umfassendes Grundverständnis der Prinzipien und Praktiken des Softwaretestens vermitteln soll. Ziel der Zertifizierung ist es zum einen, die Theorie des Software-Testens zu validieren und zum anderen kurze Einblicke anhand einfacher praktischer Szenarien darzubieten. Dieses Wissen wird durch Multiple-Choice-Fragen geprüft.

1.2 ChatGPT im Einsatz bei der ISTQB Foundation Level Prüfung

ChatGPT, ein fortschrittliches Sprachmodell von OpenAI, basiert auf der Transformer-Architektur, die es ermöglicht, aus großen Textmengen zu lernen und so relevante Antworten auf Benutzeranfragen zu generieren. Im Gegensatz zu traditionellen Anwendungen im Bildungsbereich, bei denen ChatGPT zur Lernunterstützung eingesetzt wird, haben wir ChatGPT direkt in den Prozess der Beantwortung von ISTQB Foundation Level Prüfungsfragen integriert. Dies ermöglicht eine direkte Bewertung der Fähigkeit des Modells, standardisierte Testfragen unter Prüfungsbedingungen zu beantworten und bietet eine einzigartige Perspektive auf die Eignung solcher Modelle zur Simulation menschlicher Testteilnehmer.

1.3 Die Bedeutung der direkten Integration von ChatGPT in die Prüfung

Durch den Einsatz von ChatGPT in einem Prüfungsszenario untersuchen wir, inwieweit Künstliche Intelligenz in der Lage ist, Wissen unter Testbedingungen zu demonstrieren. Dieser Ansatz wirft wichtige Fragen bezüglich der Validität von KI-gesteuerten Antworten in Prüfungen auf und bietet gleichzeitig Einblicke, wie zukünftige Testformate möglicherweise angepasst werden müssen, um die Authentizität und Fairness von Zertifizierungsprozessen zu gewährleisten.

 

2. Methodik

2.1 Testdesign und Durchführung mit ChatGPT

Um die Fähigkeit von ChatGPT zu evaluieren, reale Prüfungsfragen des ISTQB Foundation Level zu beantworten, wurde ein experimentelles Design verwendet, das eine direkte Interaktion des Modells mit realen Prüfungsfragen vorsah. Für die Studie wurden zwei spezifische Prüfungen des ISTQB FL verwendet: Foundation Level 3 und Foundation Level 4. Diese Prüfungen bestehen jeweils aus einer Reihe von Multiple-Choice-Fragen, die die Grundlagen des Softwaretestens abdecken.

ChatGPT wurde jede Frage einzeln mit den entsprechenden Antwortmöglichkeiten präsentiert. Nachdem das Modell eine Antwort ausgewählt hatte, wurde es gefragt: "Bist du sicher?". Diese Frage sollte das Modell dazu anregen, seine Antwort zu überprüfen und gegebenenfalls zu revidieren. Wenn das Modell unsicher war oder eine andere Antwort wählte, wurde die Frage erneut gestellt, um die endgültige Antwort zu ermitteln (ChatGPT ).

Integration visueller Inhalte:

Einige der Prüfungsfragen waren mit Diagrammen verknüpft, die wichtige Informationen zur Beantwortung der Fragen lieferten. Diese Diagramme wurden ChatGPT in Form von Bildern zur Verfügung gestellt. Das Modell nutzte seine Bildanalysefähigkeiten, um den Inhalt der Diagramme zu verstehen und die Informationen in die Antworten zu integrieren. Diese Fähigkeit, visuelle und textbasierte Daten zu integrieren, ist entscheidend für die Beantwortung von Fragen, die ein Verständnis komplexer Szenarien erfordern, wie sie häufig in beruflichen Zertifizierungstests vorkommen.

2.2 Datenanalyse und Bewertungskriterien

Die Richtigkeit der ChatGPT-Antworten wurde durch einen Vergleich mit den offiziellen Antwortschlüsseln der Prüfungen überprüft. Die Ergebnisse wurden in drei Kategorien unterteilt

  1. Direkt richtig: Fragen, die beim ersten Versuch korrekt beantwortet wurden.

  2. Korrigiert: Fragen, bei denen ChatGPT seine anfängliche Antwort nach der Nachfrage geändert hat und die endgültige Antwort korrekt war.

  3. Falsch: Fragen, bei denen das Modell auch nach der Nachfrage eine inkorrekte Antwort lieferte.

Für jeden Test wurden die Gesamterfolgsquoten berechnet, wobei besonders darauf geachtet wurde, wie oft ChatGPT seine Antwort nach der Nachfrage änderte und ob diese Änderungen zu einer korrekten Antwort führten.

2.3 Bewertung der Authentizität und Reliabilität

Um die Zuverlässigkeit von ChatGPT in einem realen Prüfungskontext zu bewerten, wurde nicht nur die Genauigkeit der Antworten analysiert, sondern auch deren Konsistenz bewertet. Dies beinhaltet eine Untersuchung der Fälle, in denen das Modell seine Antwort auf Nachfrage änderte, was Aufschluss über die Fähigkeit von ChatGPT gibt, unter Unsicherheit zu agieren und Entscheidungen zu revidieren.

Durch diesen methodischen Ansatz konnten wir ein klares Bild davon gewinnen, wie effektiv ChatGPT bei der Beantwortung standardisierter Testfragen ist und welche Implikationen dies für den Einsatz von KI in Zertifizierungsprüfungen haben könnte. Im folgenden Kapitel werden die spezifischen Ergebnisse dieser Untersuchung detailliert dargestellt und analysiert.

 

3. Ergebnisse

3.1 Leistung von ChatGPT in den ISTQB Foundation Level Prüfungen

ChatGPT wurde in zwei ISTQB Foundation Level Prüfungen (Level 3 und Level 4) getestet, um seine Fähigkeit zu bewerten, standardisierte Testfragen zu beantworten. Die Ergebnisse sind wie folgt:

Foundation Level 3:

  • Gesamterfolgsrate: ChatGPT erzielte eine beeindruckende Genauigkeit von 97,5%. Nach Berücksichtigung der Unsicherheiten bei den Antworten reduzierte sich diese Rate auf 82,5%.

  • Direkt richtig: 34 von den gestellten Fragen wurden sofort korrekt beantwortet.

  • Korrigiert: Bei 6 Fragen lieferte ChatGPT anfangs eine falsche Antwort, änderte diese jedoch nach der erneuten Aufforderung.

  • Falsch: Nur eine Frage wurde durchgehend falsch beantwortet.

 

Foundation Level 4:

  • Gesamterfolgsrate: Hier erreichte ChatGPT eine Genauigkeit von 85%.

  • Direkt richtig: 33 Fragen wurden von Anfang an korrekt beantwortet.

  • Korrigiert: Eine Frage wurde zunächst falsch beantwortet, jedoch nach der Nachfrage korrigiert.

  • Immer falsch: 6 Fragen wurden durchgehend falsch beantwortet.

 

3.2 Analyse der Ergebnisse

Die hohen Erfolgsquoten von ChatGPT bei ISTQB Foundation Level Prüfungen zeigen, dass das Modell gut auf die Beantwortung standardisierter Testfragen trainiert ist. Es ist jedoch wichtig zu verstehen, dass die Fähigkeit von ChatGPT, seine Antworten zu korrigieren, nicht unbedingt auf ein tieferes Verständnis des Themas oder adaptives Lernen hinweist. Vielmehr spiegelt dies die Fähigkeit des Modells wider, Muster in den Trainingsdaten zu erkennen und seine Antworten auf der Grundlage von Wahrscheinlichkeiten und gelernten Datenmustern zu optimieren. Dies bedeutet, dass ChatGPT in der Lage ist, die statistisch wahrscheinlichste Antwort auf der Grundlage der ihm zur Verfügung stehenden Informationen auszuwählen, was nicht immer gleichbedeutend mit einem tatsächlichen Verständnis der Frage ist. Diese Einschränkung unterstreicht die Notwendigkeit, die Ergebnisse KI-gestützter Testantworten sorgfältig zu evaluieren und ihre Anwendung in Prüfungsszenarien kritisch zu hinterfragen. Gleichzeitig bietet der Algorithmus aber auch die Möglichkeit, die von ihm generierten Texte zu überprüfen. ChatGPT hat kein Ego und kann sich völlig wertfrei selbst überprüfen.

Besonders bemerkenswert ist, dass ChatGPT für eine FL4-Aufgabe selbst ein Python-Skript erstellt und ausgeführt hat. Das Skript und die Antwort waren korrekt.

 

Image
ChatGPT Python Skript bei ISTQB FL Prüfung
Bild: Ausführung eines Python-Skripts von ChatGPT im Rahmen einer ISTQB Foundation Level Prüfung [Quelle: Qytera]

 

4. Diskussion

4.1 Analyse der Implikationen von ChatGPTs Leistung

Die hohe Genauigkeit von ChatGPT in ISTQB Foundation Level Prüfungen wirft wichtige Fragen bezüglich der Fähigkeiten von Large Language Models (LLMs) wie ChatGPT auf. Trotz der beeindruckenden Leistung bei der Beantwortung standardisierter Testfragen zeigt die Analyse, dass ChatGPT in erster Linie Muster in großen Datenmengen erkennt und auf dieser Basis Antworten generiert. Die Prüfung kann daher nicht wirklich darauf abzielen, ein vertieftes Verständnis eines Themas abzufragen, was für die Beurteilung von Kompetenzen in vielen Berufsfeldern unerlässlich ist. Die Ergebnisse legen nahe, dass eine Prüfung wie ISTQB Foundation Level durch reines Auswendiglernen bestanden werden kann. Welchen Wert hat das dann?

Darüber hinaus könnten solche Technologien traditionelle Prüfungsformate herausfordern. Einerseits bietet die Integration von KI in Prüfungsumgebungen die Möglichkeit, die Effizienz von Prüfungen zu steigern und neue Formate zu entwickeln, die adaptives Lernen fördern. Andererseits muss sorgfältig abgewogen werden, wie diese Technologien die Authentizität und Fairness von Prüfungsergebnissen beeinflussen können.

4.2 Erörterung der ethischen und praktischen Fragen

Ein kritischer Aspekt beim Einsatz von LLM in Prüfungen ist das Proctoring und die Sicherstellung der Authentizität der Prüfungsergebnisse. Der Einsatz von KI zur Beantwortung von Prüfungsfragen wirft Fragen hinsichtlich der Gültigkeit der Testergebnisse auf, da nicht sichergestellt werden kann, dass die Antworten das tatsächliche Wissen des Prüflings widerspiegeln. Dies könnte dazu führen, dass Prüfungsformate angepasst werden müssen, um die Integrität des Zertifizierungsprozesses zu gewährleisten. Solche Anpassungen könnten beispielsweise strengere Proctoring-Verfahren oder die Entwicklung von Testfragen umfassen, die weniger anfällig für die Beantwortung durch KI sind. Die Zertifizierungsstellen des ISTQB FL sind in Hinsicht auf Proctoring bereits sehr gut aufgestellt. Betrug durch KI wird bereits durch sehr strenge Regeln, wie Bildschirm- und Tonfreigabe und die Anwesenheit eines menschlichen Beobachters, verhindert und sollte auch in anderen Formaten Anwendung finden. Denn was wäre ein Zertifikat wert, das komplett mit ChatGPT und ohne jegliches eigenes Verständnis bestanden werden kann? Die Fragen könnten stärker an KI angepasst werden, um geringere Erfolgschancen durch KI-Nutzung zu verhindern. Erfreulich wäre eine häufige ausreichende Rotation der Prüfungsfragen, die zu keiner Zeit einen spürbaren Nachteil bei den Prüflingen mit sich bringt, aber gleichzeitig die Benutzung von KI-Tools benachteiligt.

 

5. Fazit

Die Zertifizierungsstellen stehen vor der Herausforderung, angemessen auf die Integration des lebenslangen Lernens zu reagieren. Dies könnte bedeuten, dass die Prüfungsstandards überarbeitet werden müssen, um den neuen Realitäten des digitalen Zeitalters Rechnung zu tragen. Darüber hinaus sollte sich zukünftige Forschung darauf konzentrieren, wie KI in der Bildung und Zertifizierung ethisch und effektiv eingesetzt werden kann, ohne die Qualität und Fairness der Prüfungen zu gefährden. Darüber hinaus ist es wichtig, pädagogische Ansätze und Testmethoden zu entwickeln, die die Vorteile von KI nutzen und gleichzeitig kritisches Denken und vertieftes Verständnis fördern.

Insgesamt bietet die Integration von KI in die Bildungs- und Zertifizierungslandschaft sowohl spannende Möglichkeiten als auch große Herausforderungen. Die Bildungsgemeinschaft muss diese Entwicklungen aktiv begleiten und gestalten, um die Potenziale voll auszuschöpfen und gleichzeitig ethische Standards und die Qualität der Bildung zu sichern.

 

Unsere Empfehlung

Aufgrund der strengen Richtlinien erachten wir die ISTQB Foundation Level Zertifizierung weiterhin für sinnvoll und zielgerichtet. Deswegen bieten wir von Qytera auch einen umfassenden Kurs als Vorbereitung für die Prüfung an, sodass Sie die Inhalte auch wirklich verstehen und in Ihrer täglichen Arbeit anwenden können.  Weitere Informationen und Termine finden Sie hier:

ISTQB Certified Tester Foundation Level 4.0 - Schulung & Prüfung

Veröffentlicht am 01.August 2024

Aktualisiert am 08.August 2024

Matthias Eggert

DevOps Engineer

Matthias war viele Jahre in der Automobilbranche als Softwareintegrator, Softwareentwickler und DevOps-Engineer tätig. Dabei ging es immer um sicherheitsrelevante Funktionen wie Bremssysteme oder Batteriemanagementsysteme. Jetzt arbeitet er als DevOps-Engineer bei Qytera und beschäftigt sich sowohl mit modernen Arbeitsweisen, als auch mit aktuellen Technologietrends.