Uitschieters voorspellen

Hoe kun je uitschieters voorspellen?

Een uitschieter is een datapunt dat buiten het verwachte bereik van de gegevens valt. Dat wil zeggen: het is een ongebruikelijk groot of klein gegevenspunt. Uitschieters kunnen een aanzienlijke negatieve invloed hebben op de prognoses. Het is daarom verstandig om ze nooit te negeren.

Dit artikel onderzoekt drie verschillende benaderingen voor het voorspellen van uitschieters. Tevens worden er de voor- en nadelen van de benaderingen besproken. Tenslotte worden er aanbevelingen gedaan over wanneer het het beste is om elke benadering te gebruiken.

Optie 1. Uitschieter correctie

Een eenvoudige oplossing om de impact van een uitschieter te verminderen is vervanging. Door de uitschieter te vervangen door een meer typische waarde voordat de prognoses worden gegenereerd. Dit proces wordt ook wel “uitschieter correctie” genoemd. Veel prognoseoplossingen, waaronder Forecast Pro, bieden geautomatiseerde procedures voor het detecteren van uitschieters en het “corrigeren” van de historie voorafgaand aan de prognose.

Het corrigeren van de geschiedenis van een ernstige uitschieter zal de voorspelling vaak verbeteren. Als de uitschieter echter niet ernstig is, kunnen correcties meer kwaad als goed doen. Wanneer er een uitschieter gecorrigeerd wordt, herschrijf je al het ware de geschiedenis. Dit met als doelstelling deze vloeiender te laten verlopen dan deze in werkelijkheid was. Dit zal de prognoses veranderen en betrouwbaarheidsgrenzen verkleinen. Als de correctie niet nodig is, kun je eindigen met slechte prognoses en onrealistische betrouwbaarheidslimieten.

uitschieters voorspellen forecast pro

De bovenstaande schermafbeelding toont het vermogen van Forecast Pro TRAC om potentiële uitschieters te “corrigeren”.

Aanbevelingen voor de correctie van uitschieters

  1. Als de oorzaak bekend is, moeten alternatieve benaderingen (zoals optie 2 en optie 3) worden overwogen voordat overgegaan wordt tot correctie;
  2. Uitschieter correctie moet spaarzaam uitgevoerd worden. Het is erg handig om een geautomatiseerd detectie-algoritme te gebruiken om potentiële uitschieters te identificeren. De gedetecteerde uitschieters zouden echter idealiter individueel door de voorspeller moeten worden beoordeeld om te bepalen of een correctie passend is.
  3. Wordt er een geautomatiseerde procedure gebruikt voor het opsporen en corrigeren van uitschieters? Dit kan bijvoorbeeld als het enorme aantal te genereren prognoses menselijke beoordeling onmogelijk maakt. In een dergelijk geval dienen de drempels voor het identificeren en corrigeren van een uitschieter zeer hoog worden vastgesteld. Idealiter zouden de drempels empirisch worden gekalibreerd door te experimenteren met een subset van de gegevens.

Optie 2. Scheid de vraagstromen

Soms, wanneer de oorzaak van een uitschieter bekend is, kan het nuttig zijn om een tijdreeks op te splitsen in twee verschillende vraagstromen en deze afzonderlijk te voorspellen. Onderstaand drie voorbeelden van dergelijke situaties:

Voorbeeld A: De vraag van een farmaceutisch bedrijf naar een bepaald medicijn bestaat uit zowel receptvullingen (verkoop) als gratis goederen. Bijvoorbeeld monsters die gratis aan artsen worden uitgedeeld. De timing van de distributie van gratis goederen introduceert uitschieters in de tijdreeks die de totale vraag vertegenwoordigt. Door de vraagstromen te scheiden, ontstaat een uitschietervrije serie voorschriftvullingen en kunnen voor elke reeks verschillende prognosebenaderingen worden gebruikt, wat geschikt is omdat de factoren die de vraag genereren voor de twee reeksen verschillend zijn.

Voorbeeld B: De vraag van een productiebedrijf bestaat normaal gesproken uit bestellingen van zijn distributeurs. Als reactie op een ongebruikelijke gebeurtenis plaatst de overheid een grote eenmalige order die een significante uitschieter in de vraagreeks introduceert. Deze heeft echter geen invloed op de basisvraag van de distributeurs. Door de vraagstromen te scheiden, ontstaat een vraagreeks zonder uitschieters en kan de prognose voor de vraagreeks van de overheid eenvoudig op nul worden gezet.

Voorbeeld C: Een voedings- en drankenbedrijf verkoopt zijn producten zowel uit de winkelschappen als uit promotionele displays. Het heeft toegang tot gegevens voor de twee afzonderlijke vraagstromen. Hoewel het verleidelijk is om deze twee reeksen afzonderlijk te voorspellen, is dit misschien niet de beste aanpak. Hoewel de promotionele displays de totale vraag zullen doen toenemen, zullen ze ook de basisvraag kannibaliseren. In dit voorbeeld kan het beter zijn om de totale vraag te voorspellen met behulp van een prognosemethode die de promoties kan accommoderen (bijv. gebeurtenismodellen, regressie, enz.).

Aanbevelingen voor het scheiden van vraagstromen

  1. Het scheiden van de vraagstromen moet alleen worden overwogen als u de verschillende vraagbronnen begrijpt die de uitschieters introduceren;
  2. Als de vraagstromen op een “chirurgisch schone” manier kunnen worden gescheiden, kunt u overwegen de vraagstromen te scheiden en afzonderlijk te voorspellen;
  3. In gevallen waarin de vraagstromen niet goed gescheiden kunnen worden, werkt u vaak beter met één tijdreeks.

Optie 3. Gebruik een prognosemethode die de uitschieters kan modelleren

Uitschieters kunnen worden veroorzaakt door gebeurtenissen waarvan je op de hoogte bent. Bijvoorbeeld promoties, eenmalige bestellingen, stakingen, rampen, enz.. Ze kunnen echter ook worden veroorzaakt door gebeurtenissen waarvan u geen kennis heeft (d.w.z. je weet dat het punt ongebruikelijk is , maar je weet niet waarom). Als je kennis hebt van de gebeurtenissen die de uitschieters hebben veroorzaakt, kun je overwegen een prognosemethode te gebruiken die deze gebeurtenissen expliciet modelleert.

Gebeurtenismodellen zijn een uitbreiding van exponentiële afvlakking die bijzonder geschikt zijn voor deze taak. Ze zijn eenvoudig te bouwen en lenen zich goed voor automatisering. Een andere optie is dynamische regressie.

In tegenstelling tot tijdreeksmethoden, die de prognoses uitsluitend baseren op de geschiedenis van het item, zijn gebeurtenismodellen en dynamische regressie causale modellen, waarmee u aanvullende informatie kunt invoeren, zoals promotieschema’s, de timing van bedrijfsonderbrekingen en (in het geval van dynamische regressie) verklarende variabelen.

Door de reactie op de gebeurtenissen vast te leggen als onderdeel van het algehele voorspellingsmodel, verbeteren deze technieken vaak de nauwkeurigheid van de voorspellingen en bieden ze inzicht in de impact van de gebeurtenissen.

Aanbevelingen voor het gebruik van prognosemethoden die in staat zijn om uitschieters te modificeren

In gevallen waarin de oorzaken van de uitschieters bekend zijn, kunt u overwegen een prognosemethode te gebruiken die de gebeurtenissen expliciet modelleert.

Samenvatting

Het negeren van grote uitschieters in data leidt vaak tot slechte prognoses. De beste aanpak voor het voorspellen van gegevens die uitschieters bevatten, hangt af van de aard van de uitschieters en de middelen van de voorspeller.

In dit artikel hebben we drie benaderingen besproken:

  1. Correctie van uitschieters;
  2. Het scheiden van de vraagstromen;
  3. Het modelleren van de uitschieters.

Deze benaderingen kunnen allen gebruikt worden bij het maken van prognoses op basis van gegevens die uitschieters bevatten.

Als je wil zien hoe Forecast Pro TRAC jouw organisatie kan ondersteunen bij het beheren van uitschieters en het aanpakken van andere prognose-uitdagingen, plan dan een gepersonaliseerde demo met een van onze specialisten.

Originally published at http://www.forecastpro.com/resources/blog/

0 antwoorden

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *