Door André van Delft
Leerlingen zitten op aanmerkelijk grotere scholen en in aanmerkelijk grotere klassen dan wat het ministerie van Onderwijs, Cultuur en Wetenschap beweert. Er wordt domweg gerommeld met cijfers.
De vakbond Leraren in Actie is een petitie gestart tegen overvolle klassen. Binnen een week is die door 7000 mensen ondertekend. De kwestie van de schaalgroottes in het onderwijs leeft kennelijk bij mensen.
Vorige week nog antwoordde staatssecretaris Dekker op vragen van het lid Jasper van Dijk (SP) over steeds grotere klassen:
“Uit het onderzoek van OCW blijkt een gemiddelde groepsgrootte van 22,8 leerlingen in 2012.”
Hier begin het gerommel. Op het eerste gezicht lijkt dat gemiddelde van 22,8 leerlingen per klas te kloppen. Maar in werkelijkheid hebben we het hier over een schoolvoorbeeld van misleidende statistiek.
Want hoe wordt er hier gerekend? Je krijgt dit aantal door het totaal aantal leerlingen te delen door het aantal klassen. Dat is fout. In de discussie om de kwaliteit van het onderwijs moet het natuurlijk gaan om de gemiddelde groottes van klassen en scholen zoals leerlingen die ervaren. Voor klassen is dat 24,0 leerlingen. Je krijgt dat aantal als je aan elke leerling zou vragen hoe groot zijn klas is, en het totaal van al die antwoorden deelt door het aantal leerlingen. 24,0 is het getal dat het ministerie hoort te publiceren.
De fout van het ministerie is significant. Er staat niet 23 maar 22,8; dat suggereert een bepaalde nauwkeurigheid middels het cijfer 8 achter de komma: het werkelijke aantal zou tussen 22,75 en 22,85 moeten liggen. De werkelijkheid wijkt hiervan sterk af.
Twee Gemiddelden
Hoe kan je op 2 verschillende gemiddelden uitkomen? Met een extreem voorbeeld probeer ik het statistische systeem duidelijk te maken.
Denk aan het hypothetische geval dat er 1 klas is met 30 leerlingen en 1 met 3 leerlingen. De gemiddelde klassengrootte zou dan volgens het ministerie (30+3)/(1+1) = 33 / 2 = 16,5 zijn. Maar er zijn 30 leerlingen die zullen zeggen dat ze in een klas van 30 leerlingen zitten; het aantal 30 moet je dus 30 maal in de berekening meenemen; en het aantal 3 driemaal. Uiteindelijk moet je delen door het aantal leerlingen. De grootte van de klassen waar de leerlingen gemiddeld in zitten is dan (30 x 30 + 3 x 3) / (30+3) = 909 / 33 = 27,5 leerlingen (afgerond). Laten we dit het gewogen gemiddelde noemen, tegenover het andere ongewogen gemiddelde.
Waarom noemt het ministerie het foute, lage gemiddelde? Is dat opzettelijk, omdat dit het regeringsbeleid mooier doet lijken dan het is? Of is het onkunde, hetgeen eigenlijk onacceptabel zou moeten zijn voor een ministerie dat ook Wetenschap in de naam heeft. Ik zou niet weten wat erger is.
Overigens heeft het ministerie de berekening van de klassengroottes vorig jaar laten valideren door onafhankelijke wetenschappers. Raar dat die wetenschappers het probleem van het misleidende ongewogen gemiddelde niet rapporteerden.
Melkert vs Fortuyn
Zoals zo vaak valt er dus eenvoudig te misleiden met slechte statistiek; overheidsbeleid wordt systematisch fraaier voorgesteld dan het in werkelijkheid is. Dat gebeurde ook op 12 april 2002, in een debat tussen Melkert en Fortuyn. Halverwege spraken zij over onderwijs. Melkert had zich voorbereid met cijfers van het ministerie, en vuurde een paar quizvragen af op Fortuyn (Het fragment staat op 21.30.)
Melkert: U legt een verband tussen ziekteverzuim en grootschaligheid. Laten we nou eens kijken wat de gemiddelde grootte is van een school. Hoeveel leerlingen er in een gebouw zitten in het basisonderwijs of in het voortgezet onderwijs. Enig idee?
Fortuyn: Ja dat weet ik. Basisonderwijs – zo’n twee-, driehonderd leerlingen.
Melkert: Mis, 160. Voortgezet onderwijs?
Fortyn: 1000, 1200.
Melkert: 320.
Ik heb na dat debat gekeken naar de cijfers die staatsecretaris Adelmund enkele maanden eerder had geproduceerd.
In de bijlage staat op pagina 3 dat de gemiddelde grootte per gebouw voor het basisonderwijs 163 was. Er waren wat meer gedetailleerde gegevens over de basisscholen zelf (waarvan sommige in meerdere gebouwen waren gehuisvest). Daarvan was de gemiddelde grootte 220. Ik kon met behulp de details een redelijke schatting maken van het gewogen gemiddelde, dus de grootte gemiddeld ervaren door de leerlingen. Dat bleek 288 te zijn; 31% meer dan het gemiddelde dat het ministerie opleverde. Ervan uitgaande dat hetzelfde percentage ook van toepassing zou zijn op de gemiddelde grootte per gebouw zou ik dan uitkomen op 209, dus in het bereik dat Fortuyn had genoemd.
Zie hier en hier.
Helaas hadden NRC en Volkskrant toen geen interesse in deze analyse.
Een paar jaar geleden vernam ik dat voor de notitie van Adelmund grote scholengemeenschappen niet elk als één grote school telden maar als verschillende kleine scholen die toevalligerwijs binnen één gebouw of gebouwencomplex lagen; zo werden groottes omlaaggeknoeid. Daarom, en vanwege de andere systematische misleiding, zou Fortuyns schatting voor de middelbare scholen reëeler kunnen zijn geweest dan het officiële gemiddelde.
Technische Details
Voor wie het interesseert enkele technische details.
In Dekkers brief van 15 november 2012 staat een grafiek:
Een beetje onhandig in deze grafiek is de indeling op de horizontale as. Dit lijkt lineair te zijn, maar er staat: “3 5 6 7 …” : de 4 ontbreekt dus. Slordig, maar geen ramp. In de publicatie OCW Kerncijfers 2012 komt deze grafiek ook voor, op pagina 80, maar nu met een grotere fout: onder de balkjes op oneven posities staat nu “1 3 5 …”; dat is dus steeds 3 te weinig, afgezien van het eerste getal dat 2 te weinig is.
Het aardige van de grafiek is dat we de percentages per klassengrootte kunnen aflezen. Dat heb ik gedaan, en alle percentages bij elkaar opgeteld kwam ik uit op 99,9%, dus mijn aflezing was redelijk nauwkeurig. Met een spreadsheet reproduceerde ik het foute gemiddelde van Dekker (22,8), en berekende met een eenvoudige formule het correcte gemiddelde (24,0).
De formule berekent het gewogen gemiddelde van aantallen leerlingen per school of klas, waarbij de weegfactor gelijk is aan datzelfde aantal leerlingen. Wiskundigen zien hier een kwadratisch gemiddelde opdoemen.
Voor beide gemiddelden zijn er zelfs mooie functies van de aantallen leerlingen in de klassen. Schrijf “li” voor het aantal leerlingen in klas “i” (waarbij i varieert van 1 tot 67000, want er zijn 67000 klassen). Dan geldt voor het ongewogen gemiddelde G1 en het gewogen gemiddelde G2:
Wat kan wiskunde toch mooi zijn.
Conclusie
De staatssecretaris zou gezien de lopende petitie snel moeten verklaren dat de gebruikte methodiek voor de bepaling van de gemiddelde groottes voor basisonderwijs en middelbaar onderwijs niet klopt. Hij zou ook een overzicht moeten geven met alle gepubliceerde, misleidende gemiddelden, en daarnaast de reële gemiddelden sinds 2000.
Meer lezen
Op de website Sargasso kwam eind 2012 een stuk over de klassengroottes; ook dit verwees naar de brief van Dekker van 15 november dat jaar.
Ook het CBS heeft problemen met gemiddelden; zie het Jaarboek Onderwijs in Cijfers
PS
Ik gebruik in dit stuk het woord “klas” ook voor “groep” van een basisschool.
PPS
In 1991, sociologist Scott Feld applied the class size paradox to social networks, demonstrating that the average person has fewer friends than his/her friends do. (In network terms, having more friends is called having a higher “degree.”) This is because being part of your friend’s circle of friends is like being a member of a class at a university. The size of those circles of friends varies, and there are more people in the large circles of friends than in the smaller circles of friends. The typical person will be friends with an unusually popular person.