artikelen

Trump, Brexit en Big Data

brexit-worth

Het jaarthema van PRANO was ‘BIG DATA en het onderwijs‘. Ik hoop dat de aanwezigen er iets van opgestoken hebben, of dat het voor hen althans een aangenaam verpozen is geweest.

Buiten het onderwijs was 2016 in ieder geval een machtig mooi jaar voor ‘Big Data’. Er was een ‘Big Data’-feestje rond de Brexit en deze week dan nog een tweede vreugdevuur der ijdelheden rond de Amerikaanse presidentsverkiezingen. Dat opiniepeilingen er bij verkiezingen grandioos naast zitten is inmiddels heel oud nieuws. Het nieuwe nieuws is dat het voorspellen van uitslagen niet beter gaat nu we steeds meer data hebben, en die data ook onmiddellijk online kunnen zien en verwerken. ‘Big Data’ lijken niet effectiever dan ‘Small Data’.

Bij de Brexit zaten alle peilingen die voorafgaand aan het referendum waren gehouden, er naast. Alleen het peilingsmodel van de Universiteit van Sheffield kwam redelijk in de buurt maar toen dat met een echte, heus definitieve voorspelling kwam van de uitslag was er op 95% van de kiesbureaus al uitgeteld. Je hebt kennelijk bijna alle data nodig om te voorspellen wat de uitslag zal zijn als alle data binnen zijn.

Nog leuker waren deze week de Amerikaanse presidentsverkiezingen. Voor de Grote Dag was er geen enkele peiling die Trump als winnaar voorspelde. Maar dat is dus weer het oude nieuws. Op de verkiezingsdag (in Nederland – nacht) zelf hadden de commentatoren van CNN en andere zenders echter de beschikking over de echte data. En die data waren al heel snel heel erg BIG. Online werden de uitslagen van de kiesbureaus verwerkt door de rekenmodellen achter die prachtige grafische kaarten. Niet alleen per staat, maar per district werden de cijfers verzameld en aan de kijker doorgegeven. Hoeveel stemmen er al binnen waren (exact, geen afrondingen), hoeveel stemmen er naar welke kandidaat waren gegaan (exact, geen afrondingen), hoe de procentuele verhouding was tussen de kandidaten (nu wel met afrondingen), en onderin welk percentage van de stemmen al geteld was (afgerond op hele procenten).

De commentator van CNN klikte lustig over de grote virtuele wandkaart, zoomde in, zoomde uit, legde uit wat de kijker zag, gaf duiding, benadrukte dat het nu ging om echte stemmen niet om prognoses, benadrukte dat het natuurlijk niet garandeerde dat dit of dat de uitslag zou zijn, maar toch, maar toch. Hier, in Dade Florida, hier had mevrouw Clinton nog wel 100.000 stemmen ‘op de bank’. Want zie, de verhouding was daar 65% voor Clinton en iets van 32% voor Trump, en er was nog slechts 15% van de stemmen geteld…

De eerste uren bleef de commentator van CNN uitleggen dat mevrouw Clinton op allerlei banken in Florida en North Carolina en Pennsylvania nog hopen stemgeld had staan. Pas rond een uur of drie (Nederlandse tijd) kwam hij op het idee om na te gaan of Trump in Florida en andere ‘swing-states’ nog reserves had. Dat bleek zo te zijn. In sommige districten waarvan op voorhand vast stond dat daar 90% op Trump zou gaan stemmen, daar was nog niets geteld. Nu ja, dat waren natuurlijk ook maar kleine districten. Er woonden een paar honderd boeren, niet meer, en die waren misschien niet eens gaan stemmen.

Rond vijf uur begon het de commentatoren te dagen: ze hadden de kaarten en de cijfers verkeerd gelezen. In die districten waar maar een paar honderd boeren woonden, waren bijna alle boeren naar de stembus getrokken. Trump had daar veel meer stemmen ‘op de bank’ gehad dan ze hadden gedacht. In de ‘stedelijke’ gebieden met veel hoogopgeleiden daalde het percentage Clinton-aanhangers naarmate een groter deel van de stemmen geteld was. Clinton bleek daar veel minder stemmen ‘op de bank’ te hebben gehad dan ze in het begin van de avond gedacht hadden.

Voor dat laatste zijn twee verklaringen te bedenken:

1.

De percentages bij Clinton en Trump waren bij het begin gebaseerd op de telling van de stemmen die VOOR de verkiezingsdag, per post of anderszins, waren uitgebracht. Omdat Clinton-kiezers oververtegenwoordigd waren onder de ‘vroege’ stemmers gaf vertekende dat het percentage voor Clinton naar boven. Dat effect ebde echter langzaam weg naarmate er meer stemmen van de verkiezingsdag zelf waren geteld.

2.

Terwijl de percentages voor Clinton en Trump verschillen van district tot district, zijn er ook verschillen BINNEN elk district. Ook binnen een overwegend stedelijk district heb je een ‘landelijk’ gebied waar dan natuurlijk vooral Trump-keuters wonen. Maar de telmachines in de stedelijke gebieden van een stedelijk district werken vlotter dan die in het landelijke gebied van een stedelijk district, en – als Clinton vooral aanhangers heeft in de centra met grote zakenkantoren e.d. – een telmachine in een stedelijk gebied van een stedelijk district zal meer stemmen voor Clinton registreren dan stemmen voor Trump. Die snellere telmachines is overwegend Clinton-gestemde regio’s van stedelijke districten stuwden haar percentage opwaarts. Dat effect ebde echter langzaam weg naarmate er meer stemmen van de tragere telmachines mee waren genomen.

Door de avond heen is er achter de schermen bij de nieuwszenders en door de rekenaars van de politieke partijen driftig gewerkt om de cijfers die binnenstroomden voor allerlei factoren te corrigeren. Opleidingsniveau, percentage latino’s, langjarig opkomstpercentage enzovoorts. Maar als een van de twee verklaringen die hierboven genoemd zijn, klopt, dan was al dat driftig gedoe tevergeefs. Je kunt niet corrigeren voor factoren die verband houden met de samenstelling van de populaties maar niet voor verschillen in het tempo waarin data vanuit die populaties binnenstroomt. Het enige wat je kunt doen – en dat is hierboven gedaan – is een effect benoemen en aankondigen dat dat effect gaandeweg zal wegebben. Op welke punt de teller zal staan als het effect is weggeëbd daar heb je geen idee van. Het enige wat al in het begin van de avond zeker was, was dat het percentage voor Clinton in ‘haar’ districten gaandeweg zou dalen.

‘Big Data’, of het een hype is of een heuse revolutie, dat weet ik niet. Duidelijk is wel dat wie niet begrijpt hoe data geïnterpreteerd moeten worden, van steeds meer data niet veel wijzer van zal kunnen worden.

Cum Laude voor de staatssecretaris

Staatssecretaris Sander Dekker is blij, zeer blij. Het slagingspercentage slaagt en veel leerlingen op het VO slagen met vlag en wimpel. Aldus het persbericht van 28 november 2016, zie: Eindexamens beter gemaakt.

Een persbericht vanuit het Ministerie van OCW bevat altijd tenminste 1 reclameboodschap voor het gevoerde beleid. In dit geval ziet Sander D. in de cijfers een bevestiging van het beleid met strakkere exameneisen. Critici daarvan hebben ongelijk want:

a) er zijn meer ‘cum laude’ leerlingen dus de betere leerlingen zijn nog weer wat beter geworden;

b) het slagingspercentage stijgt dus de zwakkere leerlingen zijn er niet de dupe van geworden.

Of deze zelf-felicitatie van de staatssecretaris terecht is, is uit het persbericht niet op te maken. Het is ook niet op te maken uit de gegevens die het Ministerie van OCW vrijgeeft op Onderwijsdata. Immers, uit de data die het Ministerie publiek maakt, kunnen cijferlijsten van leerlingen afzonderlijk niet gereconstrueerd worden. Je kunt dus niet bepalen hoeveel leerlingen er in eerdere jaren het predicaat ‘cum laude’ hebben gehad. Evenmin kun je bepalen of de cijfers bij de ‘zwakkere’ leerlingen door de bank genomen toch wat lager zijn geworden.

Zelfs als het Ministerie van OCW deze gegevens wel publiceert, zou er heel wat statistisch werk gedaan moeten worden voordat er vanuit het Ministerie victorie gekraaid mag worden. De examencijfers in de verschillende jaren zouden bezien moeten worden vanuit verschillende, potentieel relevante factoren. Zo is het heel wel mogelijk dat er een significante correlatie is tussen de hoogte van cijfers die leerlingen halen en het weer op de examendag. Iedereen die ooit naar school is gegaan, weet hoe lastig het is om half-doorweekt een multiple-choice lijst in te kleuren (en hoe verleidelijk daar vaart achter te zetten om snel naar huis te kunnen). Ook andere potentieel relevante factoren, zoals het lawaai in de omgeving van het examenlokaal, zouden niet in de analyse betrokken kunnen worden. Bij alle ‘BRON’-verzamelzucht is het Ministerie vergeten gegevens over dit soort factoren te verzamelen. Feit is dat de meeste factoren waarvan we allemaal weten dat die op het niveau van de individuele leerlingen relevant zijn voor het examenresultaat tot dusverre in het geheel niet in kaart zijn gebracht. De analyses van examengegevens die het Ministerie afscheidt, hebben de diepgang van de analyses van een seismoloog die aardbevingen in Japan probeert te voorspellen aan de hand van de hoogte van de golven voor de kust van Fukushima.

Deze vergelijking is misschien te hard. Het valt de staatssecretaris niet aan te rekenen dat van alle factoren die een rol spelen in het primaire proces tot dusverre alleen die gegevens zijn ‘gedataficeerd‘ die we honderd jaar geleden ook al verzamelden, maar dan op papier. Learning analytics is een jonge vakdiscipline. Mogelijk zijn de datasystemen van het Ministerie over een jaar of vijftien meer bij de tijd dan nu.

Ernstiger – omdat data daarover al wel binnen handbereik liggen – is dat het Ministerie voorspelbare en documenteerbare neveneffecten van het eigen beleid niet onderzocht lijkt te hebben. Onder druk van het zgn. ‘discrepantie-criterium’ (het verschil tussen het cijfer op het Schoolexamen en het Centraal Examen) hebben sommige scholen er beleid van gemaakt bij werkstukken en projecten geen negens en tienen meer te geven. Dat is immers een effectieve manier om het cijfer voor het SE wat omlaag te krijgen zonder dat het onmiddellijk ‘zeer’ doet bij leerlingen afzonderlijk. Echter, die scholen zullen er – bij het intern bestuderen van de examencijfers – achter zijn gekomen dat dit beleid relatief tot het ‘discrepantie-criterium’ een te zwaar middel is. Het is, in relatie tot dit criterium, niet nodig om de SE-cijfers voor ALLE leerlingen neerwaarts te duwen. Het is voldoende om dit te doen bij de leerlingen die wat zwakkere papieren hebben voor het eindexamen. De leerling waarvan vrij zeker is dat die bij het centraal examen een hoog cijfer zal halen, kun je zonder problemen een negen geven voor een werkstuk mits je dat niet doet bij de leerling die bij het centraal examen maar net een voldoende zal halen.#

Het is dus heel wel voorstelbaar dat de zorg die er bij scholen leefde rond het ‘discrepantie-criterium’ de cijfers van ALLE eindexamenkandidaten een tijdje neerwaarts beinvloed heeft maar dat dit effect voor de ‘betere’ leerlingen is wegge-ebd. Examenkandidaten die in 2010 het predicaat cum laude niet zouden hebben gekregen omdat het ‘discrepantie-beleid’ bij hen tot lagere cijfers had geleid, zouden dat predicaat in 2016 wel gekregen hebben. En – iets subtieler – eindexamenkandidaten die vanwege het ‘discrepantie-beleid’ in 2010 gezakt zijn, zouden in 2016 geslaagd kunnen zijn.$ De ontwikkelingen die de staatssecretaris meent te zien zijn dan inderdaad een gevolg van de strengere exameneisen, maar op een andere manier dan de staatssecretaris denkt.

Het is wel fijn dat de staatssecretaris zo tevreden is over de leerlingen, docenten en besturen in het Voortgezet Onderwijs. Als het nu – zonder een lerarenregister, zonder een schoolleidersregister, zonder een bestuurdersregister – al zo goed gaat, dan zou de staatsecretaris al die ideeen over hoe het bestuur van scholen nog beter te maken misschien wel in de ijskast kunnen (terug)zetten.

 

# Niet alle scholen hebben een “geen negens meer voor werkstukken”-regel ingevoerd.  Voor andere beleidsmaatregelen waarmee scholen met het discrepantie-criterium aan de slag zijn gegaan, geldt echter ook dat deze beleidsregels zodanig bijgesteld kunnen worden dat het neerwaartse effect op het SE-cijfer alleen de cijfers van de zwakkere leerlingen raakt.

$ Dit ligt subtieler omdat dit vereist dat de school zich realiseert dat de beleidsregel waarmee de cijfers neerwaarts gedrukt zijn nader kunt verfijnen: je mag een leerling die over de gehele linie ‘zwakker’ is, best een negen geven voor een werkstuk in een vak waarin die leerling goed is zonder dat daarmee het ‘discrepantie’-risico ondraaglijk wordt.

ETHIEK VAN IMMANUEL KANT

[vc_row][vc_column width=”2/3″][vc_column_text]

INLEIDING

De aanleiding voor dit essay is de opkomst van de aandacht voor ethiek van Kant in organisaties. Zo halen bijvoorbeeld bestuurders van grote organisaties regelmatig de media met onderwerpen die aan zelfverrijking, misbruik van informatie of macht doen denken. Ethiek is derhalve tijdelijk actueel in de media, maar ethiek biedt altijd een leidraad voor het antwoord op de vragen: “Wat moet ik doen? Waar ben ik toe verplicht?” Kant heeft in het kader van de opbouw van een ehtisch oordeel, drie kritieken geschreven die als drieluik kunnen worden opgevat. Dit zijn: Der Kritik der Reine Vernunft waarin zijn kenleer is opgetekend, Der Kritik der Praktische Vernunft waarin de route naar een ethisch oordeel is verwoordt, en de Kritik der Urteilskraft waarin het synthese-oordeel beoogd wordt tussen enerzijds de kenleer en anderszijds de ethiek.

Iedereen beschikt in allerlei situaties over natuurlijke condities van zijn eigen persoonlijkheid plus de toevallige empirische inwendige en uitwendige condities in tijd en ruimte, waar men mee geconfronteerd wordt in de vorming van een moreel oordeel. Niet iedereen hoeft, noch kan dezelfde ethische keuzes maken.

[/vc_column_text][/vc_column][vc_column width=”1/3″ el_class=” “][vc_single_image image=”8659″ img_link_target=”_self” img_size=”large”][vc_column_text]

Klik hier voor de gehele pdf.

[/vc_column_text][/vc_column][/vc_row]

DE NATURALISERING VAN DE GEEST

[vc_row][vc_column width=”2/3″][vc_column_text]

INLEIDING

De stelling in dit essay is, dat naturalisering van het mentale nog niet mogelijk is. Daniel Dennett (1987) onderscheidt drie manieren om tegen een complex systeem (machine, computer, organisme, mens) aan te kijken, namelijk vanuit het fysische perspectief, vanuit het perspectief van zijn ontwerp en vanuit intentioneel perspectief.

Uit het werk van Dennett kan geconcludeerd worden dat zowel het fysische als het ontwerp perspectief, beiden kunnen leiden tot een te naturaliseren systeem. Maar ten aanzien van het intentionele is dat nog niet te concluderen. Daarom wordt dit perspectief in dit essay nader bekeken.

[/vc_column_text][/vc_column][vc_column width=”1/3″][vc_row_inner][vc_column_inner width=”1/1″][vc_single_image image=”8659″ img_link_target=”_self” img_size=”large”][vc_column_text]

Klik hier voor de gehele pdf.

[/vc_column_text][/vc_column_inner][/vc_row_inner][/vc_column][/vc_row]

Kant over liegen

[vc_row][vc_column width=”2/3″][vc_column_text]

INLEIDING

‘Kant lijkt de kracht van zijn eigen ideeën te onderschatten. Waarheid en eerlijkheid hoeven niet afhankelijk gemaakt te worden van degene die de vragen stelt. Voor Kant is dé centrale ethische vraag hoe mensen in verschillende contexten, de kwaliteiten waarheid/eerlijkheid trouw kunnen blijven?’ Procee, H. (2004). Immanuel Kant en het volle leven. Budel: uitgeverij Damon.

Vanuit bovenstaande citaat wordt in dit essay dieper ingaan op de deontologische ethiek en dan specifiek, de categorische imperatief van Kant. Het debat rond algemene geldigheid van ethische principes is actueel. In dat debat kan Kant’s ethiek worden beschouwd als een uiterste positie.

[/vc_column_text][/vc_column][vc_column width=”1/3″][vc_column_text]

 

brug

Voor het artikel klik hier

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/3″][/vc_column][vc_column width=”1/3″][/vc_column][vc_column width=”1/3″][/vc_column][/vc_row]