Onze opdrachtgever moet met enige regelmaat uit een groot archief enkele tientallen pdf-bestanden opleveren, waarin het BSN van personen onleesbaar is gemaakt. Dat werd gedaan door een afdruk te maken, met een stift het BSN onleesbaar te maken en de afdrukken te scannen. Maar nu moeten er meer dan tienduizend documenten opgeleverd worden.
We hebben een archief van tienduizenden pdf-documenten, verdeeld over een aantal zip bestanden en een lijst van de personen, waarvan de documenten opgeleverd moeten worden. Het BSN kan op een beperkt aantal plaatsen in die documenten voorkomen.
Kan KeyScript een tool ontwikkelen om de juiste pdfs bij elkaar te zoeken en het BSN onleesbaar te maken?
We ontwikkelden een tool, dat de lijst met personen uit een Excel bestand leest. Vervolgens worden de relevante pdfs uit de zips gehaald. Iedere pdf wordt doorzocht op het voorkomen van het BSN op de mogelijke posities. Als dit wordt aangetroffen, wordt het afgedekt met een zwarte balk. Omdat de oorspronkelijke pdf niet alleen een afbeelding van het document, maar ook de onderliggende tekst bevat, wordt de pdf opgeslagen als ‘image only’, zodat de pdf het BSN op geen enkele manier meer uit het document gehaald kan worden. De nieuwe pdfs worden weer in een zip bestand opgeslagen, zodat ze eenvoudig opgeleverd kunnen worden.
Ontwerp Studio Broodnodig