Immer wieder ist vollmundig zu hören „KI vernichtet Arbeitsplätze“, „KI übernimmt gesamte Geschäftsprozesse“, „Künstliche Intelligenz revolutioniert Lehre“oder gar „KI ersetzt den Menschen“. Wie ist der Stand der Technik Anfang 2026 tatsächlich und in welchem Rahmen ist eine Generative KI wie ChatGPT ein praktisches Werkzeug oder gar ein Ersatz für menschliche Fertigkeiten.
Der Begriff KI hat eine breite Bedeutung. Dieser Artikel verwendet den Begriff KI stellvertretend für die auf Generativer KI basierten Großer Sprachmodelle und am Beispiel der in 2025 veröffentlichten Testergebnisse von ChatGPT.
Renommierte Große Sprachmodelle, wie beispielweise Claude, ChatGPT, Gemini oder Perplexity, werden regelmäßig und umfangreich auf ihr Wissen und Können mit menschlichen Prüfungsfragen und eigens für KI entwickelten Tests geprüft. Diese Ergebnisse werden üblicherweise auf sogenannten „LLM Leaderboards“ (Ranglisten der Großen Sprachmodelle) veröffentlicht. Nachfolgend eine Übersicht der Testergebnisse von ChatGPT 5.2 von OpenAI:
Die im Diagramm vorgestellten Testergebnisse liefern einen Eindruck über die KI-Fähigkeiten in den Bereichen „Abstraktes Denken“, „Interpretation von Abbildungen“, „Mathematik“, „Softwareentwicklung“ und „Wissensarbeitsaufgaben“ (Arbeitsaufgaben aus 9 Branchen und 44 Berufen). Farblich hervorgehoben ist der Schwierigkeitsgrad der Fragen durch die Kategorien „Schule & Ausbildung“ (grau) und „Beruf & professionelle Praxis“ (blau).
Ins Auge fällt, dass die Ergebnisse für den Bereich Schule & Ausbildung (Durchschnitt von 85%) sowohl insgesamt als auch in jeder einzelnen Kategorie deutlich höher liegen als die Ergebnisse des Bereichs „Beruf & professionelle Praxis“ (Durchschnitt von 54%).