Artikel

Bijzondere persoonsgegevens uit openbare bronnen: wat mag je verwerken, en wat niet?

8 juni 2026

Geschreven door Sander Smit

Voor bijzondere categorieën van persoonsgegevens, zoals gegevens over gezondheid, politieke opvattingen of religieuze overtuigingen, geldt op grond van de AVG een verwerkingsverbod.[1] Het verwerken van dit soort gegevens is alleen toegestaan indien er een uitzondering van toepassing is. De AVG voorziet onder meer in een uitzondering wanneer de betrokkene de gegevens kennelijk openbaar heeft gemaakt.[2] Dit klinkt op het eerste gezicht als een mooie opening voor het verwerken van openbaar toegankelijke bijzondere persoonsgegevens. Maar wees gewaarschuwd: het HvJ-EU legt deze uitzondering streng uit.

In het eerste artikel van deze reeks liet ik zien dat het openbare karakter van een bron de AVG niet uitschakelt; in het tweede dat openbaarheid kan meewegen, maar nooit doorslaggevend is. Dit derde artikel zoomt in op het strengste regime van de AVG: namelijk dat voor bijzondere persoonsgegevens. Ik bespreek de opzet van artikel 9 AVG, de strikte maatstaf die het Hof van Justitie hanteert voor uitzonderingen, de toepassing op web scraping en AI-training, en de praktische consequenties voor organisaties die openbare gegevens verwerken.


Het juridisch kader: een verbod met smalle uitzonderingen
Het uitgangspunt van artikel 9 AVG is helder: het verwerken van bijzondere persoonsgegevens is verboden. Deze categorie omvat gegevens waaruit ras of etnische afkomst, politieke opvattingen, religieuze of levensbeschouwelijke overtuigingen of het lidmaatschap van een vakbond blijken, alsook genetische en biometrische gegevens met het oog op unieke identificatie, gegevens over gezondheid en gegevens over seksueel gedrag of seksuele geaardheid. Het verbod weerspiegelt het inzicht dat verwerking van deze categorieën aanzienlijke risico’s met zich brengt voor de fundamentele rechten en vrijheden van natuurlijke personen.

Op het verbod kent artikel 9, lid 2, AVG tien limitatieve uitzonderingen. Volgens vaste rechtspraak van het HvJ-EU vormen zij een gesloten stelsel en moeten zij restrictief worden uitgelegd.[3] Voor het thema van deze reeks over openbaar toegankelijke informatie is in het bijzonder relevant dat er een uitzondering bestaat voor kennelijk openbaargemaakte gegevens.[4]

Ook belangrijk: de uitzonderingen van artikel 9, lid 2, AVG schakelen artikel 6 AVG niet uit. Wie bijzondere persoonsgegevens wil verwerken, heeft een dubbele grondslag nodig – naast een uitzondering op het verwerkingsverbod ook een rechtsgrond voor de verwerking als zodanig. Deze grondslagen van artikel 6 – en hoe zij zich verhouden tot openbaar toegankelijke informatie – zijn in het tweede artikel. van deze reeks besproken. Openbaarheid van gegevens maakt geen einde aan de verplichting een grondslag te identificeren; zij verandert hooguit, in beperkte mate, het palet van uitzonderingen op het verwerkingsverbod.


Het HvJ-EU (Hof van Justitie van de Europese Unie) hanteert een strikte maatstaf

Meta Platforms v. Bundeskartellamt
In het arrest Meta Platforms v. Bundeskartellamt oordeelt het HvJ-EU dat niet uit het enkele bezoek aan websites of apps kan worden afgeleid dat de daarbij gegenereerde (bijzondere) persoonsgegevens kennelijk door de gebruiker openbaar zijn gemaakt.[5]

Het Hof formuleerde een duidelijke maatstaf: de betrokkene moet “vooraf uitdrukkelijk de keuze hebben gemaakt, in voorkomend geval op basis van met volledige kennis van zaken gekozen individuele instellingen, om de hem betreffende gegevens openbaar toegankelijk te maken voor een onbeperkt aantal personen.”[6]

In de praktijk betekent dit dat de uitzondering voor het verwerken van openbaar toegankelijke bijzondere persoonsgegevens alleen opgaat wanneer de betrokkene een bewuste en geïnformeerde keuze heeft gemaakt om de gegevens openbaar te delen. Het enkele feit dat iemand een Like-knop aanklikt op Facebook, of dat gegevens zichtbaar zijn op een openbaar profiel, is daarvoor onvoldoende. De uitzondering gaat niet op wanneer de betrokkene niet de mogelijkheid had om de zichtbaarheid via privacy-instellingen te beperken, of wanneer hij niet vooraf is geïnformeerd over de gevolgen van zijn handeling.[7]

Schrems v. Meta
In het tweede artikel van deze reeks kwam de zaak van Schrems tegen Facebook al naar voren. Schrems had tijdens een openbare paneldiscussie in Wenen zijn seksuele geaardheid ter sprake gebracht, specifiek om het privacybeleid van Facebook te bekritiseren. De discussie was toegankelijk voor publiek, werd gestreamd en later als podcast gepubliceerd. Schrems had zijn seksuele geaardheid echter nooit vermeld op zijn Facebook-profiel. Desondanks verzamelde Meta via cookies en sociale plug-ins op websites van derden (waaronder sites gericht op een homoseksueel publiek) gegevens waaruit zijn seksuele geaardheid bleek. Op basis van deze gegevens richtte Meta gepersonaliseerde reclame op hem.[8]

Het Hof oordeelt hier dat zelfs wanneer een betrokkene persoonsgegevens over zijn seksuele geaardheid kennelijk openbaar heeft gemaakt, in dit geval door een verklaring tijdens een openbare paneldiscussie, dit de exploitant van een sociaal netwerk niet machtigt om andere gegevens over diezelfde categorie te verwerken.[9] De openbaarmaking van Schrems ziet alleen op het concrete gegeven dat hij zelf openbaar heeft gemaakt: hier dus de verklaring over zijn seksuele geaardheid tijdens het rondetafelgesprek. Daaruit volgt niet dat alle verdere gegevens over zijn seksuele geaardheid, zoals gegevens afkomstig van datingapps of websites van derden, eveneens kennelijk openbaar zijn gemaakt.

De uitzonderingsgrond van artikel 9, lid 2, sub e, AVG blijft dus beperkt tot de specifieke persoonsgegevens die de betrokkene zelf kennelijk openbaar heeft gemaakt, en kan niet worden gebruikt als algemene vrijbrief om andere gevoelige gegevens over hetzelfde onderwerp te verzamelen, te combineren of te analyseren.[10] Bovendien maakt het Hof expliciet dat openbaarmaking niet mag worden gelijkgesteld met uitdrukkelijke toestemming in de zin van artikel 9, lid 2, sub a, AVG.[11]

De EDPB Richtsnoeren
De European Data Protection Board (EDPB) heeft deze maatstaf in zijn richtsnoeren over targeting van sociale-mediagebruikers verder ingevuld.[12] Volgens de EDPB ligt de drempel voor ‘kennelijk’ hoog en moet steeds een combinatie van factoren worden gewogen: de standaardinstellingen van het platform, de actieve handeling van de gebruiker die nodig zijn om die instellingen te wijzigen, de zichtbaarheid voor de gebruiker dat de gegevens publiek worden, en of de betrokkene de gegevens zelf publiceerde dan wel dat een derde dat deed of dat de gegevens uit ander gedrag werden afgeleid. Geen van deze factoren is op zich beslissend; samen moeten ze het beeld opleveren van een welbewuste keuze.[13]

Hieruit volgt ook een belangrijk gevolg voor de bewijslast. Het is aan de verwerkingsverantwoordelijke om aan te tonen dat de uitzondering van toepassing is, niet aan de betrokkene om dat te weerleggen. 

Deze arresten hebben een grote betekenis voor het gebruik van openbaar toegankelijke bijzondere persoonsgegevens. Denk aan de verwerking van politieke uitingen op openbare fora, gezondheidsgegevens die mensen delen op sociale media, of religieuze voorkeuren die blijken uit online gedrag. In al deze gevallen moet de verwerkingsverantwoordelijke zich niet alleen afvragen of de gegevens openbaar zijn, maar ook of de betrokkene ze bewust en geïnformeerd openbaar heeft gemaakt. Is dit niet het geval? Dan mogen de gegevens niet worden verwerkt, althans: niet via de uitzonderingsgrond voor kennelijk openbaar gemaakte persoonsgegevens.


Actueel: web scraping en AI-training
De vragen rondom openbaar toegankelijke gegevens en de AVG zijn de afgelopen jaren in een stroomversnelling geraakt door de opkomst van generatieve AI. Grote taalmodellen worden getraind op enorme hoeveelheden gegevens die veelal via web scraping van het openbare internet worden verzameld. Dat deze gegevens openbaar toegankelijk zijn, maakt de verwerking ervan niet automatisch rechtmatig.

In de wetenschappelijke literatuur is overtuigend betoogd dat wanneer bijzondere en niet-bijzondere persoonsgegevens bij web scraping en bloc worden verwerkt, zonder dat de verwerkingsverantwoordelijke deze op het moment van verzameling kan scheiden, het geheel onder het strengere regime van artikel 9 AVG valt.[14] Dit vloeit rechtstreeks voort uit het arrest Meta v. Bundeskartellamt, waarin het HvJ-EU oordeelde dat het strengere regime omtrent bijzondere persoonsgegevens van toepassing is ongeacht of de verwerkingsverantwoordelijke de intentie had om deze bijzondere persoonsgegevens te verwerken.[15]

De CNIL (het Franse equivalent van de AP) heeft uitvoerige richtsnoeren gepubliceerd over de toepassing van de AVG op web scraping.[16] De CNIL concludeert dat web scraping op zichzelf niet onverenigbaar is met de AVG, maar dat de verwerkingsverantwoordelijke aan een reeks voorwaarden moet voldoen. Zo moet het precieze verzamelcriteria vooraf definiëren en technische filters toepassen om de verzameling van onnodige gegevenscategorieën te voorkomen.[17]Daarnaast moet worden beoordeeld of betrokkenen hun gegevens bewust openbaar hebben gemaakt in de zin van de jurisprudentie van het HvJ-EU.[18]

Op Europees niveau heeft de European Data Protection Board hierover in december 2024 Opinie 28/2024 vastgesteld.[19] De EDPB benoemt drie kernvragen: wanneer een AI-model anoniem kan zijn, wanneer een beroep op gerechtvaardigd belang als grondslag voor training of gebruik mogelijk is, en wat de gevolgen zijn van een AI-model dat is getraind op onrechtmatig verzamelde persoonsgegevens. Specifiek voor scraping waarbij persoonsgegevens kunnen worden verzameld noemt de opinie aanvullende mitigerende maatregelen: actief filteren van risicocategorieën, uitsluiten van bronnen waarvan publicatie schadelijk kan zijn voor natuurlijke personen, en waarborgen tegen onbedoeld vastleggen en heruitgifte van gevoelige gegevens.[20] Het signaal is duidelijk: ongericht scrapen zal niet rechtmatig zijn, en de aanwezigheid van bijzondere persoonsgegevens in trainingsdata vraagt om expliciete maatregelen.

Ook de Autoriteit Persoonsgegevens neemt op dit punt een uitgesproken positie in. In haar voorlichting over scraping uit 2024 stelt de toezichthouder dat scraping door private partijen in veel gevallen onrechtmatig zal zijn — juist omdat er geen uitzonderingsgrond voor het verwerken van bijzondere persoonsgegevens zal zijn.[21]


Wat betekent dit in de praktijk?
Op basis van het voorgaande kunnen voor het verwerken van bijzondere persoonsgegevens uit openbare bronnen de volgende aanbevelingen worden geformuleerd.

Toets de dubbele grondslag
Voor bijzondere persoonsgegevens is een uitzondering uit artikel 9, lid 2, AVG nooit voldoende. Een rechtsgrond uit artikel 6 AVG blijft onverkort vereist. Identificeer beide vooraf en onderbouw ze elk afzonderlijk.

Documenteer de bewuste en geïnformeerde keuze
De bewijslast voor ‘kennelijk openbaar gemaakt’ ligt bij de verwerkingsverantwoordelijke. Vastlegging van de standaardinstellingen van het platform, de actieve handeling van de betrokkene en de zichtbaarheid van het publieke karakter is daarvoor van groot belang. Zonder dossier is een beroep op de uitzondering niet houdbaar.

Beperk je tot wat de betrokkene zelf openbaar maakte
Het arrest Schrems/Meta sluit extrapolatie uit. Wie openbaar maakte tot een bepaalde religieuze stroming te behoren, machtigt daarmee niet tot een bredere profilering op datzelfde gebied uit andere bronnen. De uitzondering reikt niet verder dan de gegevens die feitelijk en welbewust openbaar zijn gemaakt.

Filter actief bij scraping en AI-training
Wie ongedifferentieerd verzamelt en pas achteraf categorieën onderscheidt, valt voor het geheel onder het regime van artikel 9 AVG. Bouw filtering in op het moment van verzameling, sluit risicobronnen uit, en documenteer de toegepaste maatregelen – overeenkomstig de voorbeelden die de EDPB in Opinie 28/2024 noemt.


Conclusie
De uitzondering voor kennelijk openbaar gemaakte gegevens lijkt een opening, maar het Hof houdt haar bewust smal. De drempel om gegevens te verzamelen ligt laag, een ingebedde plug-in die bijzondere persoonsgegevens ontsluit, is daarvoor al genoeg. De drempel om je op de uitzondering te beroepen ligt juist hoog: alleen een bewuste, geïnformeerde keuze om dit ene gegeven voor een onbeperkt publiek toegankelijk te maken, telt. Die asymmetrie is de kern van de bescherming.

Voor de praktijk betekent dit dat openbaarheid bij bijzondere gegevens vrijwel niets oplevert: de uitzondering reikt niet verder dan wat de betrokkene zélf deelde, en ontslaat de verwerker nooit van de plicht óók een grondslag uit artikel 6 te hebben. Wie ongericht scrapet, roept het strengste regime over de héle dataset over zich af.


voetnoten:

[1] Artikel 9, lid 1, AVG.
[2] Artikel 9, lid 2, sub e, AVG.
[3] HvJ EU 21 december 2023, C-667/21, Krankenversicherung Nordrhein, ECLI:EU:C:2023:1022, r.o. 42 en 50. zie ook HvJ EU 4 juli 2023, C-252/21, Meta Platforms e.a., ECLI:EU:C:2023:537, r.o. 76.
[4] Artikel 9 lid 2 sub e AVG.
[5] HvJ-EU 4 juli 2023, C-252/21 (Meta/Bundeskartellamt), r.o. 79.
[6] HvJ-EU 4 juli 2023, C-252/21 (Meta/Bundeskartellamt), r.o. 85.
[7] HvJ-EU 4 juli 2023, C-252/21 (Meta/Bundeskartellamt), r.o. 80-82.
[8] HvJ-EU 4 oktober 2024, ECLI:EU:C:2024:834, C-446/21 (Schrems/Meta), r.o. 21–25 en 78–79.
[9] HvJ-EU 4 oktober 2024, C-446/21 (Schrems/Meta), r.o. 80 & 81.
[10] HvJ-EU 4 oktober 2024, C-446/21 (Schrems/Meta), r.o. 80 & 81.
[11] HvJ-EU 4 oktober 2024, C-446/21 (Schrems/Meta), r.o. 82.
[12] EDPB, Richtsnoeren 8/2020 betreffende de targeting van gebruikers van sociale media, versie 2.0, 13 april 2021, par. 8.2.
[13] EDPB, Richtsnoeren 8/2020 betreffende de targeting van gebruikers van sociale media, versie 2.0, 13 april 2021, par. 8.2.
[14] Zie hierover uitvoerig: S. Upadhyay, ‘Lawfulness of the mass processing of publicly accessible online data to train large language models’, International Data Privacy Law, Volume 14, Issue 4, november 2024, p. 334 e.v.
[15] HvJ-EU 4 juli 2023, C-252/21 (Meta/Bundeskartellamt), r.o. 69 en 70.
[16] CNIL, ‘The legal basis of legitimate interest: focus sheet on the measures to implement in the case of data collection by web scraping’.
[17] CNIL, ‘The legal basis of legitimate interest: focus sheet on the measures to implement in the case of data collection by web scraping’, onder: Mandatory measures.
[18] CNIL, ‘The legal basis of legitimate interest: focus sheet on the measures to implement in the case of data collection by web scraping’, onder: Mandatory measures.
[19] EDPB, ‘Opinion 28/2024 on certain data protection aspects related to the processing of personal data in the context of AI models’.
[20] EDPB, ‘Opinion 28/2024 on certain data protection aspects related to the processing of personal data in the context of AI models’, par. 104-107.
[21] Autoriteit Persoonsgegevens, ‘Handreiking scraping door particulieren en private organisaties’, par. 8 en 11.