Zoeken Contact

Het proces van data-analyse

Ontdek hoe data-analyse helpt om gegevens om te zetten in bruikbare inzichten, van inventarisatie van gegevensbronnen tot evaluatie van resultaten.

Van gegevensverzameling tot rapportage

In de wereld van onderzoek speelt data-analyse een centrale rol bij het verkrijgen van inzichten en het onderbouwen van conclusies aan de hand van gestructureerde data. Het stelt onderzoekers in staat om complexe systemen en fenomenen te ontrafelen door patronen, trends en afwijkingen bloot te leggen in grote datasets. Of het nu gaat om het begrijpen van processen binnen ERP-systemen, het analyseren van financiële data of het doorgronden van grote datasets, data-analyse is de sleutel tot het verkrijgen van inzichten.

Eerder publiceerden we over al de toepassing van data-analyse in onderzoeken aan de hand van een aantal voorbeelden. In een eerder artikel hebben wij belicht dat eDiscovery en digital forensics kunnen ondersteunen in het verkrijgen van inzicht uit ongestructureerde data.

Dit artikel belicht het proces voorafgaand aan de toepassing, vanaf de eerste inventarisatie van gegevensbronnen tot de uiteindelijke totstandkoming van bevindingen.

Het biedt een gestructureerd overzicht van de cruciale stappen die nodig zijn om ruwe gegevens om te zetten in waardevolle onderzoeksinformatie, met een focus op betrouwbaarheid, relevantie en strategische toepassing binnen onderzoek.

Inventarisatie van gegevensbronnen
De eerste stap in elk data-analyseproces is het identificeren van relevante gegevensbronnen. Dit kan variëren van interne systemen, zoals ERP- en CRM-systemen, tot externe bronnen zoals marktrapporten en openbare datasets.

Bij deze stap is het cruciaal om vragen te stellen zoals:

  • Welke gegevens zijn beschikbaar en hoe sluiten ze aan bij de doelstellingen van het onderzoek? Wij zien in de praktijk dat crediteurenbetalingen gecomprimeerd worden getoond op een bankafschrift. Als de doelstelling van het onderzoek is om crediteurenbetalingen inzichtelijk te maken is aanvullende informatie uit de financiële administratie nodig om de dataset compleet te maken.
  • In hoeverre zijn deze gegevens geschikt voor de beantwoording van de onderzoeksvragen? Een voorbeeld betreft de geschiktheid van logdata in onderzoeken naar het wijzigen van gegevens in systemen. Het kan zijn dat alleen al het openen van een document door systemen wordt gelogd als wijziging. In dat geval is de data uit de logging minder geschikt voor het onderzoek, omdat het geen expliciete gebruikershandelingen betreft..
  • Hoe toegankelijk zijn deze gegevens, en welke tools of autorisaties zijn nodig om ze te verkrijgen? Dit zien wij in de praktijk bij onderzoeken naar transacties die verder in het verleden hebben plaatsgevonden. Administratiebescheiden (boekingsregels, bankafschriften etc) worden vanuit beleid meestal vernietigd na de wettelijke bewaartermijn van 10 jaar.

Een goede inventarisatie legt de basis voor een efficiënte analyse. Het voorkomt dat relevante data niet wordt meegenomen in het onderzoek of dat irrelevante data wordt betrokken in het onderzoek.

Databewerking
Voordat analyses kunnen worden uitgevoerd, is het vaak noodzakelijk om data op te schonen en te bewerken. Dit proces omvat:

  • Opschonen: Het verwijderen van duplicaten, inconsistenties en het verwijderen of aanvullen van ontbrekende waarden. Velden in een dataset die handmatig zijn ingevoerd kunnen bijvoorbeeld inconsistenties bevatten in de schrijfwijze. Zo kan een bedrijf worden aangeduid als Bedrijf X B.V., Bedrijf X of Bedrijf. Het kan voorkomen dat een auditfile (gestandaardiseerde export van boekingsregels uit een financieel pakket) geen beginbalans bevat. In dat geval zal de beginbalans worden toegevoegd.
  • Normalisatie: Het standaardiseren van gegevens om ze in een uniform formaat te brengen. In een dataset met verschillende valuta kan ervoor worden gekozen de data aan te passen naar 1 standaardvaluta om vergelijking mogelijk te maken.
  • Integratie: Het combineren van gegevens uit verschillende bronnen tot één bruikbare dataset. Eerder in dit artikel gaven wij het voorbeeld van bankafschriften met gecomprimeerde crediteurenbetalingen. In dit geval zal de dataset aangevuld worden met data uit de financiële administratie.

Databewerking neemt in het proces van data-analyse een groot deel van de tijd in beslag, maar het is essentieel om betrouwbare en bruikbare datasets te verkrijgen die ondersteunt in het beantwoorden van de onderzoeksvragen.

Plannen en uitvoeren van data-analyses
Om de data-analyse relevant te laten zijn voor het onderzoek dient voorafgaand aan de uitvoering van de data-analyse de volgende stappen te worden doorlopen:

  • Inventarisatie van onderzoeksvragen en het selecteren van geschikte analysemethoden en tools, zoals statistische modellen, machine learning-algoritmen of visualisatietools om deze vragen te beantwoorden.
  • Het opstellen van een analyseplan met duidelijke doelen, deadlines en verantwoordelijkheden. Voor een analyse van een auditfile wordt hierin opgenomen welke grootboekrekeningen of dagboeken nader worden onderzocht, welke transacties in scope van het onderzoek vallen en hoe deze worden aangesloten met andere informatie.

Tijdens de uitvoeringsfase worden patronen, afwijkingen en trends geïdentificeerd. Dit kan handmatig worden gedaan of met behulp van geavanceerde software voor geautomatiseerde analyses.

Evalueren resultaten en inzichten
Het evalueren van de resultaten is een cruciale stap in het data-analyseproces. Deze fase richt zich op het interpreteren van de bevindingen en het beoordelen van hun waarde en betrouwbaarheid in de context van het onderzoeksdoel en de onderzoeksvragen.

Bij de evaluatie van resultaten spelen de volgende aspecten een belangrijke rol:

  • Relevantie ten opzichte van de onderzoeksvraag: Sluiten de resultaten aan bij de gestelde vragen en doelen? Het is essentieel om te bepalen of de inzichten direct bijdragen aan het beantwoorden van de onderzoeksvraag of dat aanvullende analyses nodig zijn.
  • Betrouwbaarheid van de bevindingen: Hoe robuust zijn de resultaten? Dit omvat het controleren van de gebruikte methoden, de consistentie van de analyses en het identificeren van eventuele fouten of biases in het proces.
  • Toepasbaarheid in de praktijk: Kunnen de resultaten worden toegepast in een praktische context? Hierbij wordt onderzocht of de inzichten kunnen leiden tot aanbevelingen, oplossingen of vervolgonderzoek.

De evaluatie van resultaten vormt de brug tussen analyse en actie. Het stelt onderzoekers in staat om niet alleen te begrijpen wat de data zeggen, maar ook hoe deze inzichten kunnen worden vertaald naar concrete stappen of verder onderzoek. Het zorgvuldig evalueren van de uitkomsten verhoogt de impact en kwaliteit van elk onderzoek.

Tot slot
Data-analyse is een iteratief en gelaagd proces dat begint bij een zorgvuldige inventarisatie van gegevensbronnen en eindigt met het evalueren van de resultaten en inzichten. Elke stap – van het waarborgen van datakwaliteit tot het plannen en uitvoeren van analyses – speelt een cruciale rol in het succes van het project. Door dit proces te volgen, kunnen onderzoekers niet alleen patronen en trends ontdekken, maar ook een solide basis leggen voor datagedreven onderzoek.

Wilt u meer weten over het voorgaande, maak dan contact met Kim Scholten, Jelle Oorebeek of Marcel Westerhoud:

 

 

 

Bekijk gerelateerde publicaties

Interessante publicaties voor u geselecteerd

Privacy

Privacy en onafhankelijk onderzoek

Digitaal onderzoek

De kracht van AI in digitaal onderzoek

Open Source Intelligence

De rol van Open Source Intelligence in onderzoek

Frauderisico

Ontwikkelingen 2025 voor Fraude Champions

Digital Forensics en eDiscovery

Digital Forensics en eDiscovery in perspectief

Digitaal onderzoek

De wereld van digitaal onderzoek van data tot inzichten

Op deze website gebruikt Ebbenpartners cookies en vergelijkbare technieken om de website goed te kunnen laten werken en om te analyseren hoe de website wordt gebruikt.