donderdag 17 januari 2013

Sambo~ICT conferentie (2) Voorspelbaarheid van studiesucces #bigdata #samboict

Noorderpoort wil het kijken of je studiesucces kunt voorspellen. Marius van Zandwijk (Kennisnet) en Martijn Broekhuizen (Noorderpoort) geven een toelichting op een project, waarbij dit aspect wordt onderzocht. In het kader van Focus op Vakmanschap is het mooi als studenten binnen de daarvoor vastgestelde tijd hun diploma halen. Ook het terugdringen van VSV speelt een rol.

In een vooronderzoek blijken 13 factoren relevant te zijn voor het kunnen voorspellen van studiesucces. Het gaat om zaken als geslacht, leeftijd, woonsituatie, etniciteit, rugzakje, motivatie, etc.

De factoren zijn uitgesplitst naar hun relevantie in bepaalde fasen van de studieloopbaan. In een vervolgstap is bekeken welke gegevens beschikbaar zijn over de betrokken factoren.
Op basis van de gegevens in het KRD (PeopleSoft) is een analyse gemaakt. Een deel van de gegevens is niet beschikbaar. Daarvoor moeten ook andere bronnen worden geraadpleegd, bijvoorbeeld de gegevens bij de Cursistendienstverlening (verlengde intake, 2e lijns trajecten). Er is een database waarin studenten worden geregistreerd, die de open dag hebben bezocht. Ook buiten het roc wordt gekeken: bij het VO, bij VO-intergrip, waar de overstap van VO naar MBO wordt gemonitord.

In Het traject moet nog een aantal stappen gezet worden. Het achterhalen welke gegevens nu echt relevant zijn: waar zitten de correlaties? Dat kan best complex zijn omdat bepaalde factoren elkaar kunnen versterken of afzwakken. Uit eindelijk moet het leiden tot de Big Five.
Op dit moment sijn er nog issues in het traject rondom privacy: het gebruik van externe gegevens. Daarnaast is het lastig om gegevens met elkaar te koppelen. Ook valt het nog niet mee om studiesucces te definiƫren. Dat is wel wat anders dan een negatieve waarde van VSV!

Een aandachtspunt is nog, dat de correlaties in Groningen nog wel eens heel anders kunnen liggen dan in de Randstad. Daarbij is er nog de discussie over het verschil tussen correlatie en causaliteit. Een correlatie hoeft niet causaal te zijn: dat je een hogere verzekeringspremie moet betalen in bepaalde postcodegebieden is gebaseerd op een correlatie. Dat betekent niet dat daarmee aangetoond is, dat je meer risico's neemt waardoor er eerder schade is (causaal verband).

Het zou wellicht ook interessant Zijn om te kijken naar sociale verbanden, bijvoorbeeld door te kijken naar de Facebook vrienden of Twitterberichten. Danmkom je wel erg op het gebied van de privacy. De vraag is daarbij of je dan ook niet te veel gegevens probeert te analyseren.
Nog andere factoren spelen natuurlijk een rol. De kwaliteit van docenten, bijvoorbeeld. Dat is heel interessant en tegelijkertijd bedreigend voor de docenten.

Het zou mooi zijn als het traject oplevert dat bekend is welke factoren een rol spelen en wat je nog aanvullend kunt doen om gegevens boven water te krijgen, bijvoorbeeld een intaketoets. Het accent zal in elk geval komen te liggen op de intake.

Binnenkort komt er een rapport over het onderzoek uit bij Kennisnet.


H

Geen opmerkingen:

Een reactie posten

Reacties zijn welkom