Statistik in der Prüfungspraxis: Stichprobenverfahren (Teil 1)

Aufsatz von Roger Odenthal, WP Praxis 7/2020 S. 191

I. Hintergrund

Zahlreiche gestandene Prüfer entwickeln während ihres Berufslebens ein eher ambivalentes Verhältnis zur Statistik. Sie wird als theoretische oder akademische Disziplin angesehen, während sich die praktische Prüfungstätigkeit weitgehend ohne komplizierte Formeln mithilfe von Intuition und Menschenverstand erledigen lässt. Die aufgeführte Vermeidungsstrategie wird zudem durch populärere Digitalisierungsversprechen unterstützt, welche die Substitution statistischer Stichprobenprüfungen durch automatisierte Massendatenanalysen mit Hilfe künstlicher Intelligenz (KI) in den Raum stellen. Schließlich verheißen sie ein Ende ungewisser Prüferurteile, die sich lediglich an Wahrscheinlichkeiten orientieren. 

Paradoxerweise zeigt sich abseits all dieser Hoffnungen, dass gerade die ersehnte Beurteilung von Prüffeldern auf der Grundlage artifizieller Datenauswertungen solide statistische Expertise erfordert. Dies gilt gleichermaßen für die beschreibende und schließende Statistik. Schließlich lassen sich sowohl die Konfektionierung digitaler Analyseverfahren als auch eine sachkundige Einordung automatisch bereitgestellter Prüfungsergebnisse ohne entsprechende Kenntnisse kaum bewerkstelligen.

Gleiches gilt für den Einsatz grafischer Analysedashboards mit belastbaren Schlussfolgerungen zu hieraus resultierenden Kurvenverläufen. Selbst der oft beschworene Abgesang auf prüferische Beurteilungen mittels Stichprobentechnik dürfte sich in diesem Zusammenhang als voreilig erweisen. 

Erfahrungsgemäß bedürfen gerade die auf fortschrittlicher Analysetechnik basierenden „Auffälligkeiten“ einer kritischen prüferischen Begleitung und Einordnung zu deren realen Entstehungskontexten, die, wie bereits in der Vergangenheit, lediglich in Stichproben erfolgen kann. 

Wägt man alle Argumente ab, wird mathematische Statistik in sämtlichen Spielarten unser zu prüfendes Arbeitsumfeld zukünftig sogar mit zunehmender Intensität bestimmen. Schließlich warten am nahen Horizont bereits automatisierte Audit-Lösungen auf ihren Einsatz, deren „lernende“ Analysetechniken nach Einschätzung namhafter KI-Experten nicht mehr nachzuvollziehen sind. Die denklogische und kritische Auseinandersetzung mit sich hieraus ergebenden Prüfungsergebnissen entwickelt sich somit zu einer Herausforderung, der wir uns gleichermaßen mit digitalen Kenntnissen, prüferischer Erfahrung und fundiertem statistischem Anwendungswissen stellen müssen.

Wir werden uns in diesem und zwei folgenden Beiträgen lediglich mit praktischer „Stichprobentechnik“ und insoweit mit einem schmalen Ausschnitt aus dem statistischen Universum beschäftigen. Hierbei stehen zunächst begriffliche Klärungen und die Frage, warum sie funktioniert, im Vordergrund. Dieses gesicherte Fundament ermöglicht uns anschließend einige Ausflüge in die Prüfungspraxis.

II. Kernaussagen

  1. Mit der Digitalisierung des Prüfungsbereichs steigen die Anforderungen an solider statistischer Expertise.
  2. Grundlagen- und Begriffsverständnis sind für die praktische Stichprobenanwendung wichtiger als komplexe Formeln.
  3. Geringe Stichprobenumfänge und kleine Prüffelder mit hohem Stichprobenanteil erfordern besondere Aufmerksamkeit.
III. Fazit
  • Die wesentlichen Grundlagen für die Funktionsfähigkeit von Stichprobenverfahren können wie folgt zusammengefasst werden:
  • Eine einzeln gezogene Stichprobe hat einen rechnerischen Bezug zu einer Verteilung von Stichprobenmittelwerten, die wiederum von der Grundgesamtheit beeinflusst wird, aus welcher die Einzelstichprobe gezogen wurde.
  • Stichprobenverfahren beschäftigen sich sowohl mit stetigen Merkmalen (i. d. R. Werte) als auch mit diskreten Merkmalen (z. B. bei IKS-Funktionsprüfungen), die jeweils unterschiedliche Berechnungen erfordern.
  • Stichproben unterstützen unsere prüferische Beurteilung mit Schätz- und Testverfahren, die sich oft ergänzen.
  • Hypothesen eines Testverfahrens lassen sich mit einer Stichprobenprüfung nicht bestätigen, sondern lediglich falsifizieren. Eine widerlegte Hypothese leitet zu einer inhärenten oder qualifizierten Alternativhypothese.
  • Gängige Prüfsoftware begnügt sich häufig mit Testverfahren zur Absicherung der oberen Fehlergrenzen (Beta-Risiken).
  • Die Beurteilung großer Prüffelder mit vergleichsweise hohen Stichprobenumfängen erweist sich in der Praxis oft als unproblematisch. Hingegen erfordern Prüffelder, die mit geringen Stichprobenumfängen geprüft werden sollen, eine erhebliche Sorgfalt bei der Auswahl und sachgerechten Anwendung geeigneter Berechnungsmodelle.
X

Diese Website verwendet Cookies

Cookies gewährleisten den vollen Funktionsumfang unseres Angebots, ermöglichen die Personalisierung von Inhalten und können für die Ausspielung von Werbung oder zu Analysezwecken gesetzt werden. Lesen Sie auch unsere Datenschutzerklärung!
Cookie-Einstellungen

Cookies akzeptieren

Cookies erforderlich

Um fortfahren zu können, müssen Sie die dafür zwingend erforderlichen Cookies zulassen. Diese gewährleisten den vollen Funktionsumfang unserer Seite, ermöglichen die Personalisierung von Inhalten und können für die Ausspielung von Werbung oder zu Analysezwecken genutzt werden. Lesen Sie auch unsere Datenschutzerklärung.