In de vorige publicatie zijn wij ingegaan op documentstudie en digitaal onderzoek. In deze zevende publicatie nemen wij je mee in het toepassen van data-analyse in onderzoek aan de hand van enkele voorbeelden.
Voordat wij in gaan op de praktijkvoorbeelden nemen wij je mee in de voorwaarden om data-analyse te kunnen toepassen in onafhankelijk onderzoek.
Betrouwbaarheid
Data-analyse begint bij data. In onafhankelijk onderzoek is het van belang dat betrouwbare en relevante informatie wordt gebruikt. Dit geldt ook voor de data die wordt gebruikt bij data-analyse. In de vorige publicatie hebben wij in enkele voorbeelden laten zien hoe de betrouwbaarheid van data kan worden vastgesteld.
Relevante en geschikte data
In de IT wordt nogal eens de term ‘garbage in, is garbage out’ gebruikt. Als je voor data-analyse gebruik maakt van data die niet compleet of actueel is dan kan dat leiden tot bevindingen die in het belang van het onderzoek onvoldoende zeggen. Ook data die niet geschikt is om onderzoeksvragen mee te beantwoorden draagt niet bij aan het onderzoek.
Een onderzoeker zal daarom op basis van de beschikbare data het volgende inzicht moeten hebben:
Gestructureerde en ongestructureerde data
In de vorige publicatie maakten wij onderscheid tussen gestructureerde en ongestructureerde data. Data-analyse kan worden toegepast op gestructureerde en ongestructureerde data. Een voorbeeld van data-analyse op gestructureerde data is de analyse van boekingsregels. Een voorbeeld van een data-analyse op ongestructureerde data betreft het analyseren hoe vaak een zoekterm voorkomt in e-maildata.
Data-analyse kan op verschillende manieren worden toegepast in onderzoek. Hierbij geldt dat enkel data-analyse niet voldoende grondslag geeft voor een onderzoeksrapport. Data-analyse is geschikt om te bepalen op welke onderdelen het onderzoek zich verder gaat richten. Wij lichten dit toe aan de hand van een aantal voorbeelden.
Faillissementsonderzoeken
In faillissementsonderzoeken kan een analyse van de journaalposten uit de financiële administratie en bankafschriften richting geven aan het onderzoek van de curator. Een voorbeeld hiervan is het uitvoeren van een analyse op crediteurenbetalingen om te onderzoeken of er aanwijzingen zijn dat crediteuren in aanloop van het faillissement zijn voorgetrokken (selectieve crediteurenbetaling).
(Mis)bruik van systeem
Data-analyse op logbestanden kan een onderzoeker helpen in het nagaan of bepaalde frauduleuze handelingen vaker zijn verricht of door meerdere personen zijn verricht.
De organisatie had een medewerker ontslagen doordat consulten door de betreffende medewerker contant werden geïnd. De ontvangsten werden niet verantwoord in de financiële administratie. Hiertoe annuleerde de medewerker het consult achteraf in het systeem. Met data-analyse is op basis van geanonimiseerde logdata in kaart gebracht welke consulten achteraf zijn verwijderd. Deze zijn nader onderzocht om uit te sluiten dat meer medewerkers in het systeem gebruik hebben gemaakt van deze mogelijkheid.
Onrechtmatige betalingen
Data-analyse kan een onderzoeker ondersteunen in de scoping van de onderzoekswerkzaamheden.
Een financieel medewerker van een onderneming had beschikking over de bankpas en boekte de bankafschriften in de financiële administratie. De betreffende medewerker gebruikte de bankpas niet alleen om rekeningen van de werkgever te betalen, maar ook voor privé betalingen. Alle uitgaande betalingen zijn geanalyseerd op totalen per tegenrekening. Per tegenrekening is onderzocht welke facturen hier aan ten grondslag lagen en de tenaamstelling van de facturen. Daarnaast is met data-analyse in kaart gebracht hoe de betaling is verhuld in de financiële administratie.
Data-analyse ondersteunt een onderzoeker in de scoping van werkzaamheden. Op voorwaarde dat de data betrouwbaar en geschikt zijn voor het onderzoek.
In de volgende publicatie nemen wij je mee in de volgende onderzoeksmethode: het interviewproces.