Dataminingproject

Dit E-merge project maakt gebruik van de specifieke expertise binnen elk van de vier instellingen. Kern van ons project is de datamining techniek, waarvoor de expertise wordt ingebracht door LIACS van de Universiteit Leiden. Daarnaast wordt gebruik gemaakt van de data uit de relevante systemen van de TU Delft. Gebruik wordt gemaakt van de Blackboard gegevens van de complete studentpopulatie van de TU Delft. De Haagse Hogeschool heeft veel ervaring met meer traditionele vormen van onderzoek naar studiesucces en brengt die kennis in. De Hogeschool Leiden tenslotte levert een ervaren en deskundige projectleider.

Wat is datamining?

Datamining is met name een interessante techniek als het gaat om het combineren van meerdere databronnen, die niet triviaal aan elkaar te plakken zijn. In deze zin onderscheidt deze techniek zich dus van meer traditionele analysemethoden zoals statistiek en visualisatie. De patronen en verbanden die het resultaat zijn van een datamining exercitie – het model van de studentenpopulatie in dit geval – kunnen grofweg op twee manieren gebruikt worden. Aan de ene kant kunnen de resultaten gebruikt worden om beter inzicht te krijgen in het studiegedrag van (groepen van) studenten, zodat eventuele ongewenste fenomenen beter begrepen of verklaard kunnen worden. De andere manier om modellen te gebruiken is meer voorspellend. De gevonden patronen kunnen gebruikt worden om (toekomstige) studenten op te delen in groepen die al dan niet een verhoogde kans op bepaalde nadelige (of juist niet) studieverloop hebben.

In het plaatje worden de stappen die we in het project nemen weergegeven

  1. Data scraping, het verzamelen en samenbrengen van alle relevante en beschikbare data.
  2. Datamining, het identificeren en analyseren van de voetstappen die studenten achterlaten in de ICT-systemen.
  3. Het interpreteren van de – op basis van de datamining – geïdentificeerde subgroepen van studenten; en het selecteren van die groepen die betekenisvol zijn in relatie tot het doel van dit onderzoek.
  4. Het omschrijven van mogelijke acties en maatregelen op het niveau van de (onderwijs-) organisatie, van groepen studenten en van individuele studenten, ten einde de resultaten van dit onderzoek te kunnen verspreiden en te kunnen inbedden in de organisaties.

Learning analytics, wat is dat precies?

Niet iedereen is bekend met de begrip “Learning Analytics”, maar het komt de laatste regelmatig ter sprake in allerlei forums over onderwijs(onderzoek). Learning Analytics is, simpel gezegd, onderzoek naar onderwijs met behulp van ‘big data’, een ander actueel begrip.

Big data verwijst naar de digitale sporen die gebruikers achterlaten in de online applicaties die zij gebruiken. Bedrijven als Google maken hier gebruik van om te anticiperen op hun gebruikers en ze bijvoorbeeld aanbiedingen te doen die passen bij de interesses op dat moment.

Binnen het onderwijs maken we in toenemende mate gebruik van allerlei digitale applicaties en studenten laten daar ook sporen in achter. Analyse van die sporen kan inzichten opleveren in online gedrag van studenten. Dergelijke informatie kan op alle niveaus van een onderwijsinstelling interessant zijn. Studenten kunnen hun performance vergelijken met anderen, maar ze zouden ook gerichter ondersteund kunnen worden in hun leerproces. Docenten kunnen informatie krijgen over het leergedrag van studenten, om te monitoren en eventueel te interveniëren. Het management kan dergelijke data ook gebruiken, zij het op geaggregeerd niveau, voor institutioneel onderzoek.

Afgelopen jaar is er binnen E-Merge geëxperimenteerd met het toepassen van learning analytics: hoe werkt het, wat voor data is zinvol om te analyseren en wat voor informatie kan het opleveren voor wie?

In een volgende post geef ik een update over de uitkomsten van dit project.