De basis ingrediënten voor goede voorspellingen

Geplaatst door CorporatieMedia op
 

Steeds meer organisaties gaan voorzichtig de eerste stappen zetten op het gebied van predictive analytics (doen van voorspellingen), of hebben in een meerjarenplan opgenomen wanneer ze hiermee willen gaan starten. Ook op dit vlak heeft de hype rondom ChatGTP en Open AI voor een versnelling gezorgd, maar soms ook voor de verwachting dat het doen van voorspellingen tegenwoordig kinderspel is. Helaas is dit (nog) niet het geval. Naast kennis en kunde zijn er een aantal basis ingrediënten nodig die bij veel organisaties nog onvoldoende op orde zijn. Wil je dus starten met het doen van voorspellingen in de toekomst, richt je dan eerst op de basis: datavolume & datakwaliteit.

Datavolume
Datavolume verwijst naar de hoeveelheid gegevens die binnen een organisatie beschikbaar is over een bepaald onderwerp. In het kader van voorspellende analyses is datavolume van cruciaal belang. Hoe groter het datavolume, hoe meer patronen en trends er kunnen worden geïdentificeerd en hoe nauwkeuriger de voorspellingen zijn.

Bijvoorbeeld, als een ziekenhuis voorspellingen wil doen over toekomstige behandelvolumes, zal een groter datavolume - dat wil zeggen meer gegevens over eerdere patiëntresultaten, behandelingseffectiviteit, seizoensgebonden invloeden, enz. - leiden tot nauwkeurigere voorspellingen. Daarentegen kan een laag datavolume beperkte of vertekende inzichten opleveren, wat kan leiden tot minder nauwkeurige voorspellingen. Het is dus essentieel om aandacht te besteden aan het datavolume bij het opzetten van voorspellende analyses.

In de praktijk zien we vaak dat er, zeker bij systeemmigraties, onvoldoende aandacht is voor de retentie van daadwerkelijk alle gegevens. De focus ligt logischerwijs vaak op het zo snel mogelijk operationeel kunnen zijn met het nieuwe systeem, en niet zozeer op de retentie van alle data. Dit terwijl het behoud van jaren aan data en dus jaren aan informatie voor alle bedrijven steeds belangrijker gaat zijn. Benieuwd hoe je zorgt voor een centrale gegevensopslag die volledig onafhankelijk is van wijzigingen in het applicatielandschap? Lees hier meer over onze datalake en lakehouse oplossingen.

"In de wereld van voorspellende analyses is datavolume niet alleen een hoeveelheid, het is een drijvende kracht. Het verschil tussen een giswerk en een nauwkeurige voorspelling kan liggen in de diepte en breedte van je gegevens."

Datakwaliteit
Datakwaliteit is net zo belangrijk als datavolume bij het maken van betrouwbare voorspellingen. Het verwijst naar de mate waarin gegevens nauwkeurig, volledig, consistent, relevant en betrouwbaar zijn. Zonder hoogwaardige data, kunnen zelfs de meest geavanceerde voorspellende modellen leiden tot onjuiste of misleidende inzichten.

Neem bijvoorbeeld een onderwijsinstelling die voorspellingen wil doen over toekomstige inschrijvingen om haar capaciteitsplanning te optimaliseren. Als de gebruikte inschrijvingsgegevens inconsistent zijn, bijvoorbeeld door fouten in de gegevensinvoer of ontbrekende gegevens over bepaalde cursussen of periodes, dan kunnen de resulterende voorspellingen de werkelijke vraag significant over- of onderschatten. Dit kan leiden tot overbezetting of onderbezetting, wat op zijn beurt kan resulteren in inefficiënt gebruik van middelen of gemiste onderwijskansen. Het onderhouden van datakwaliteit is daarom essentieel voor het doen van nauwkeurige voorspellingen en het nemen van geïnformeerde beslissingen.

Het goede nieuws is dat onze data scientists in staat zijn om de betrouwbaarheid van elk voorspellend model inzichtelijk te maken en de zwakke punten bloot te leggen. Is de datakwaliteit een probleem? Zet dan onze datakwaliteit oplossing in om stapsgewijs te werken aan een steeds betere kwaliteit van de data. Deze oplossing laat niet alleen zien wat de uitdagingen zijn, maar maakt ook inzichtelijk hoe de datakwaliteit zich over de tijd steeds verder verbeterd. Door informatiedomeinen of zelfs velden toe te kennen aan specifieke afdelingen, rollen of personen wordt duidelijk waar de verantwoordelijkheden liggen om te borgen dat de verbetering niet een eenmalige actie is, maar juist een duurzaam resultaat oplevert.

Hier onderaan een tweetal voorbeeldschermen van de app datakwaliteit (klik voor groter). 

Bron: Blue-Mountain, Foto: Blue-Mountain