Benchmarkbestand en privacy

De Algemene Verordening Gegevensbescherming (AVG) stelt strenge eisen aan de verwerking van persoonsgegevens. Studiekeuze123 verwerkt met de NSE een aantal verschillende persoonsgegevens van studenten. Wij zorgen ervoor dat deze niet herleidbaar zijn in het benchmarkbestand.

Ontdaan van persoonsgegevens en beveiligd

Het benchmarkbestand is een openbare dataset en mag geen persoonsgegevens bevatten, conform de AVG. Het benchmarkbestand is daarom ontdaan van persoonsgegevens. Alle direct identificerende variabelen komen helemaal niet voor in het bestand en indirecte identificatie wordt voorkomen door beveiliging van het bestand. Deze beveiliging vindt plaats op een aantal achtergrondvariabelen. Dit zijn:

  • Brincode
  • Crohocode
  • Opleidingsvorm3
  • Brinvolgnummer
  • Typestudent (nieuw in 2019)

In het kort bestaat de beveiliging uit het verwijderen van records waarvoor geldt dat het aggregaat van de vijf variabelen kleiner is dan 5 respondenten. De verdere technische uitwerking vindt u hieronder.

Beveiliging van het benchmarkbestand in 2018

Het benchmarkbestand werd in 2018 beveiligd aan de hand van de respons, volgens de volgende methode:

  1. De studentaantallen worden geaggregeerd op de beveiligingssleutel (BrinActueel x CrohoActueel x Opleidingsvorm  x BrinVolgNummerActueel).
  2. Hier komt de variabele AVG uit. Van de combinaties waar n<5 was, werden de studenten op AVG=1 gezet, de rest werd AVG=0.
  3. Als het aantal studenten n van de combinatie BrinActueel, CrohoActueel, Opleidingsvorm3 en BrinVolgNummerActueel < 5 (AVG=1), dan werden de sleutelvariabelen Opleidingsvorm3 en de variabele BrinVolgNummerActueel op missing gezet (-1).
  4. Daarna werden de studentaantallen nogmaals geaggregeerd met dezelfde sleutel (BrinActueel, CrohoActueel, Opleidingsvorm3 en BrinVolgNummerActueel) maar dan met de missende waarden die in stap 5 werden toegevoegd.
  5. Hier kwam de variabele AVG2 uit. Van de combinaties waar n < 5 was, werden de studenten op AVG2=1 gezet, de rest werd AVG2=0.
  6. Als het aantal studenten n van de combinatie BrinActueel, CrohoActueel, Opleidingsvorm3 en BrinVolgNummerActueel < 5 (AVG2=1), dan werden de records verwijderd. 

Dit leidde tot verwijdering van iets minder dan 1.000 records van kleine opleidingen, het op missing zetten van opleidingsvorm3 en BrinVolgNummerActueel bij 133 records.  

Beveiliging van het benchmarkbestand in 2019

De beveiliging van het benchmarkbestand 2019 verschilt op een aantal punten van de methode die in 2018 is gevolgd. In 2019 zijn de volgende variabelen in de beveiligingssleutel voor het benchmarkbestand gebruikt: BrinActueel, CrohoActueel, Opleidingsvorm3, BrinVolgNummerActueel en TypeStudent. Dit is dezelfde sleutel als in 2019, met uitzondering van de toevoeging van TypeStudent. Type student is hier meegenomen als een dichotome variabele (regulier) – (pre-master/ post-master).

Het benchmarkbestand is in 2019 beveiligd aan de hand van de respons, volgens de volgende methode:

  1. De studentaantallen zijn geaggregeerd op de beveiligingssleutel (BrinActueel x CrohoActueel x Opleidingsvorm  x BrinVolgNummerActueel x Type Student).
  2. Hier komt de variabele AVG uit. Van de combinaties waar n<5 is, zijn de studenten op AVG=1 gezet, de rest is AVG=0.
  3. Als het aantal studenten n van de combinatie BrinActueel, CrohoActueel, Opleidingsvorm3 en BrinVolgNummerActueel x Type student < 5 (AVG=1), dan zijn de records verwijderd.

Een analyse op basis van de data van 2018 laat zien dat dit tot verwijdering leidt van ongeveer 1.300 records. Op de overige records is dan 100% data aanwezig op de 5 sleutelvariabelen.

Meer informatie over NSE en AVG

Meer over de werkwijze rondom privacy bij de NSE 2019 leest u op de instellingspagina over NSE en de AVG.

Meer over de verwerking van de persoongegevens van studenten leest u op de pagina NSE en privacy.