AI

AI kijkt nauwkeuriger na dan een docent

Is AI een betere nakijker dan de mens? ToetsPers onderzocht 20.000 open vragen en concludeert dat AI menselijke fouten vermindert bij een goed correctievoorschrift. Ontdek de toekomst van toetsing.


Door: Abel Stam | februari 2026

Het is de heilige graal van het onderwijs: een manier om de immense berg nakijkwerk te reduceren zonder in te leveren op kwaliteit. Generatieve AI (Gen AI) belooft die werkdruk te verlagen. Maar durven we een algoritme echt te laten beslissen over de cijfers van onze leerlingen?

Bij ToetsPers namen we de proef op de som. We analyseerden 20.000 beoordelingen van docenten en legden deze naast de scores van onze AI-module. De resultaten dagen ons beeld van 'eerlijk nakijken' flink uit.

De 80/20 regel van AI-nakijken

In 80% van de gevallen gaf de AI exact dezelfde score als de docent. Dat is een indrukwekkende score die aantoont dat de techniek klaar is voor het grote werk. Maar de echte lessen leerden we van die overige 20% aan afwijkingen.

Wie heeft er gelijk als de mens en de machine het oneens zijn?

e8517262-f8df-4fcd-bb5a-f6d3c8f2ccf4

Uit onze audit bleek iets opmerkelijks:

  • Matige correctievoorschriften: in 64% van de gevallen werd het correctievoorschrift als ontoereikend beoordeeld. 
  • De AI is consistenter: Bij duidelijke nakijkvoorschriften bleek de AI vaker de juiste score te geven (26%) dan de docent (10%).
  • Menselijke fouten: Docenten wisselden vaker per ongeluk "juist" en "onjuist" om, mogelijk door concentratieverlies na urenlang nakijken.

De bottleneck: Het correctievoorschrift (CV)

Waarom noemen we AI dan "nauwkeuriger" maar de docent vaak "beter"? Dat heeft alles te maken met context.

Een docent weet wanneer een leerling het 'begrijpt', zelfs als de formulering ongelukkig is. Een AI volgt de regels van het correctievoorschrift echter tot op de letter. In 64% van de gevallen waarin de scores afweken, was de oorzaak een zwak of vaag correctievoorschrift.

"AI is niet de bottleneck voor innovatie in het onderwijs; de reproduceerbaarheid van onze eigen instructies is dat wel."

Hoe maken we nakijken weer behapbaar?

De toekomst is niet 'Mens óf Machine', maar een slimme samenwerking. We kunnen AI-systemen zo inrichten dat ze de docent ondersteunen waar dat het meest effectief is:

  1. Automatiseer de extremen: als AI een 0 of de volle score geeft, klopt dit in respectievelijk 78% en 90% van de gevallen.
  2. Focus op deelscores: bij complexe vragen met deelpunten is menselijke controle nog steeds van grote waarde.
  3. Verbeter het fundament: door AI te gebruiken bij het schrijven van betere, eenduidige correctievoorschriften, stijgt de kwaliteit van de gehele toetsing.
  4. Close the loop: analyseer de toetsresultaten en gebruik statistieken om afwijkende beoordelingen op te sporen. 

Nieuwsgierig naar de volledige data? Download hier onze whitepaper of vraag direct een demo aan om te zien hoe ToetsPers de werkdruk op jouw school kan verlagen.


Andere posts