De anatomie van een voorspelling

Wat is de anatomie van een voorspelling? In dit artikel van Forecast Software wordt er het een stuk duidelijker!

Wanneer u een statistisch model gebruikt om een prognose voor twaalf maanden te genereren, krijgt u meer dan alleen twaalf cijfers. U krijgt ook veel informatie over de manier waarop de voorspelling is gegenereerd, de aansluiting van het model op de historische gegevens en verschillende metingen van de verwachte nauwkeurigheid van de voorspelling. In dit artikel ontleden en catalogiseren we de verschillende componenten van een statistische voorspelling.

anatomie voorspelling 1

De bovenstaande grafiek bevat drie componenten: de vraaggeschiedenis, de puntvoorspellingen en de vertrouwensgrenzen. Laten we ze allemaal een voor een bekijken.

Anatomie van voorspelling: Vraaggeschiedenis

De groene lijn vertegenwoordigt de historische vraag naar instantcamera’s op maandbasis. Dit type dataset, bestaande uit op gelijke afstanden gelegen waarnemingen in de tijd, wordt een tijdreeks genoemd. Een prognosetechniek die een prognose genereert die uitsluitend is gebaseerd op de vraaggeschiedenis van een artikel in het verleden, wordt een tijdreeksmethode genoemd. Doorgaans zullen tijdreeksmethoden structuren vastleggen, zoals huidige verkoopniveaus, trends en seizoenspatronen, en deze naar voren extrapoleren.

Anatomie van voorspelling: Puntvoorspellingen

De rode lijn vertegenwoordigt de puntvoorspellingen en de blauwe lijnen vertegenwoordigen de bijbehorende betrouwbaarheidsgrenzen. De toekomst is onzeker en een statistisch voorspellingsmodel vertegenwoordigt onzekerheid als een waarschijnlijkheidsverdeling. De puntvoorspelling is het gemiddelde van de verdeling en de betrouwbaarheidsgrenzen beschrijven de spreiding van de verdeling boven en onder de puntvoorspelling.

De puntvoorspelling kan worden gezien als de beste schatting van de toekomst. Het is het punt waarop het (volgens het model) even waarschijnlijk is dat de werkelijke waarde erboven of eronder zal vallen. Als we de verwachte inkomsten voor onze instantcamera’s proberen in te schatten, is dit precies wat we willen. We kunnen onze puntvoorspellingen nemen en vermenigvuldigen met onze gemiddelde verkoopprijs om onze verwachte inkomsten te berekenen.

Anatomie van voorspelling: Vertrouwensgrenzen

Aan de andere kant, stel dat we willen weten hoeveel instantcamera’s we op voorraad moeten hebben. Er zijn kosten verbonden aan het aanhouden van te veel voorraad (bijvoorbeeld opslag, veroudering, enz.) en er zijn kosten verbonden aan het niet voldoende voorraad hebben (bijvoorbeeld verloren verkopen, spoedbestellingen, enz.). Dit is waar de vertrouwensgrenzen een rol gaan spelen.

De betrouwbaarheidsgrenzen zijn gekalibreerd op percentielen. In het bovenstaande voorbeeld is de bovenste betrouwbaarheidslimiet ingesteld op 97,5% en de onderste betrouwbaarheidslimiet op 2,5%. Dit betekent dat (volgens het model) de waarschijnlijkheid dat toekomstige verkopen zich op of onder de bovenste betrouwbaarheidsgrens bevinden 97,5% is en de waarschijnlijkheid dat toekomstige verkopen zich op of onder de onderste betrouwbaarheidsgrens bevinden 2,5%. Als het dus onze wens is om een serviceniveau van 97,5% te handhaven, zouden we tot de hoogste betrouwbaarheidslimiet aanhouden. Natuurlijk kunt u met Forecast Pro de percentielen voor de betrouwbaarheidslimieten instellen op welke waarden u maar wilt.

Het gebruik van de waarden 2,5 en 97,5 voor de onder- en boven betrouwbaarheidsgrenzen is niet ongebruikelijk. Als u even over deze instellingen nadenkt, zult u zich realiseren dat de kans dat de toekomstige verkopen tussen deze boven- en ondergrenzen vallen 95% is. Sommige mensen noemen deze symmetrische combinatie van instellingen voor de bovenste en onderste betrouwbaarheidslimiet het 95%-betrouwbaarheidsinterval.

Grafieken

anatomie voorspelling

Beschouw de twee bovenstaande grafieken. De grafiek aan de linkerkant is hetzelfde als Figuur 1, behalve dat we de aangepaste waarden hebben toegevoegd. De aangepaste waarden laten zien hoe het voorspellingsmodel de geschiedenis ‘volgt’ en kunnen inzicht geven in hoe goed het model de structuur in de gegevens vastlegt.

Beschouw de grafiek aan de rechterkant. Hier gebruiken we een best passende lijn om de directe cameraverkoop te voorspellen. Zoals u zich wellicht nog herinnert uit uw kindertijd, is de vergelijking voor een rechte lijn Y = mX + b, waarbij m de helling van de lijn is, X de tijd is en b het snijpunt is. Zodra we m en b hebben geselecteerd, kan deze vergelijking niet alleen worden gebruikt om de voorspellingen te genereren, maar ook om de historische gegevens aan te passen.

e grafiek aan de linkerkant maakt gebruik van een exponentieel afvlakkingsmodel om de aangepaste waarden en voorspellingen te genereren. Hoewel de vergelijkingen voor het exponentiële afvlakkingsmodel complexer zijn dan voor een rechte lijn, wordt de berekening van de aangepaste waarden en voorspellingen op een vergelijkbare manier uitgevoerd.

Als we ons afvragen welke van de twee voorspellingsmodellen in figuur 2 waarschijnlijk de verkoop van instantcamera’s nauwkeuriger zal voorspellen, is het antwoord duidelijk het exponentiële afvlakkingsmodel. Waarom? Omdat het beter aansluit bij de historische gegevens.

OVER DE AUTEUR

Eric Stellwagen is de mede-oprichter van Business Forecast Systems, Inc. en de co-auteur van de Forecast Pro-softwareproductlijn. Met meer dan 29 jaar ervaring wordt hij algemeen erkend als een leider op het gebied van business forecasting. Hij heeft uitgebreid overlegd met veel toonaangevende bedrijven. Waaronder Coca-Cola, Procter & Gamble, Merck, Blue Cross Blue Shield, Nabisco, Owens-Corning en Verizon. Dit om hen te helpen hun prognose-uitdagingen aan te pakken. Eric heeft workshops gegeven voor verschillende organisaties, waaronder APICS, het International Institute of Forecasters (IIF), het Institute of Business Forecasting (IBF), het Institute for Operations Research and the Management Sciences (INFORMS) en de University of Tennessee. Hij is momenteel lid van de raad van bestuur van het IIF en de praktijkadviesraad van Foresight: The International Journal of Applied Forecasting.

Originally published at http://www.forecastpro.com/resources/blog/

Voorspellen met de Box-Jenkins methode

De Box-Jenkins methode (ARIMA) is een belangrijke voorspellingsmethode die zeer nauwkeurige voorspellingen kan opleveren voor bepaalde soorten gegevens. In deze aflevering van Forecasting 101 onderzoeken we de voor- en nadelen van Box-Jenkins-modellering, geven we een conceptueel overzicht van hoe de techniek werkt en bespreken we hoe we deze het beste kunnen toepassen op bedrijfsgegevens.

Een beetje geschiedenis

In 1970 populariseerden George Box en Gwilym Jenkins ARIMA-modellen (Autoregressive Integrated Moving Average) in hun baanbrekende leerboek Time Series Analysis: Forecasting and Control1. Technisch gezien is de voorspellingstechniek die in de tekst wordt beschreven een ARIMA-model, hoewel veel voorspellers (inclusief de auteur) de uitdrukkingen “ARIMA-modellen” en “Box-Jenkins-modellen” door elkaar gebruiken.

ARIMA-modellen zorgden aanvankelijk voor veel opwinding in de academische gemeenschap, vooral vanwege hun theoretische onderbouwing, waaruit bleek dat als aan bepaalde aannames werd voldaan, de modellen optimale voorspellingen zouden opleveren.

In het begin werd de techniek niet op grote schaal gebruikt door het bedrijfsleven. Dit was vooral te wijten aan de moeilijke, tijdrovende en zeer subjectieve procedure beschreven door Box en Jenkins om de juiste vorm van het model voor een bepaalde dataset te identificeren. Tot overmaat van ramp hebben empirische onderzoeken aangetoond dat, ondanks de theoretische superioriteit van het ARIMA-model ten opzichte van andere voorspellingsmethoden, de modellen in de praktijk NIET routinematig beter presteerden dan andere tijdreeksmethoden.

Afvlakkingsmodellen

Uit een bijzonder belangrijk empirisch onderzoek bleek dat exponentiële afvlakkingsmodellen 55% van de tijd beter presteerden dan Box-Jenkins op een steekproef van 1.001 datasets2. Dit is nog steeds een goed resultaat voor Box-Jenkins (het presteerde in 45% van de gevallen beter dan exponentiële afvlakking), dus de les hier is dat je idealiter zou wisselen tussen verschillende benaderingen, in plaats van een one-size-fits-all benadering te kiezen. .

De uitdaging voor een bedrijfsvoorspeller is om te bepalen welke datasets het meest geschikt zijn voor Box-Jenkins en vervolgens de juiste vorm van het model te identificeren.

De bovenstaande schermafbeelding toont de prognose die is gegenereerd op basis van een ARIMA-model, samen met de expertselectielogica en modeldetails.

Tegenwoordig gebruiken softwarepakketten zoals Forecast Pro automatische algoritmen om te beslissen wanneer Box-Jenkins-modellen moeten worden gebruikt en om automatisch de juiste vorm van het model te identificeren. Het is aangetoond dat deze automatische benaderingen beter presteren dan de handmatige identificatieprocedures en Box-Jenkins-modellen toegankelijk en bruikbaar hebben gemaakt voor de zakelijke voorspellingsgemeenschap.

Conceptueel overzicht

Hoewel er multivariabele vormen van ARIMA-modellen bestaan, wordt de methode in het bedrijfsleven vooral gebruikt als techniek voor het voorspellen van tijdreeksen. (Tijdreeksmethoden zijn prognosetechnieken waarbij de prognose uitsluitend wordt gebaseerd op de geschiedenis van het item dat u voorspelt.)

Als tijdreekstechniek zijn ARIMA-modellen geschikt als u kunt uitgaan van een redelijke mate van continuïteit tussen het verleden en de toekomst. De modellen zijn het meest geschikt voor voorspellingen op de kortere termijn – bijvoorbeeld 18 maanden of minder – vanwege hun veronderstelling dat toekomstige patronen en trends op de huidige patronen en trends zullen lijken. Dit is een redelijke veronderstelling op de korte termijn, maar wordt zwakker naarmate u verder van de voorspelling uitgaat.

Box-Jenkins-modellen lijken op exponentiële afvlakkingsmodellen in die zin dat ze adaptief zijn, trends en seizoenspatronen kunnen modelleren en kunnen worden geautomatiseerd. Ze verschillen doordat ze gebaseerd zijn op autocorrelaties (patronen in de tijd) in plaats van op een structureel beeld van niveau, trend en seizoensinvloeden. Box-Jenkins heeft de neiging beter te slagen dan exponentiële afvlakking voor langere, stabielere datasets en niet zo goed voor luidruchtigere, meer vluchtige data.

Box-Jenkins-modellen zijn wiskundig complex. In dit artikel zullen we een heel basaal conceptueel overzicht geven van hoe een ARIMA-model werkt en enkele notaties introduceren die bij het model horen. Als u meer wilt weten over Box-Jenkins-modellen: deze worden gedetailleerd besproken in de Forecast Pro Statistical Reference Manual en in vrijwel elk academisch leerboek over tijdreeksvoorspellingen.

ARIMA-model

Een ARIMA-model bestaat uit 3 componenten, die elk helpen bij het modelleren van verschillende soorten patronen. De “AR” staat voor autoregressief. De ‘ik’ staat voor geïntegreerd. De “MA” staat voor voortschrijdend gemiddelde. Elke component heeft een bijbehorende modelvolgorde die aangeeft hoe groot de component is.

In het algemeen wordt een niet-seizoensgebonden Box-Jenkins-model gesymboliseerd als ARIMA(p,d,q) waarbij “p” het aantal AR-termen aangeeft, “d” de volgorde van differentiatie aangeeft en “q” het aantal MA-termen aangeeft. voorwaarden. Een seizoensgebonden Box-Jenkins-model wordt gesymboliseerd als ARIMA(p,d,q)*(P,D,Q), waarbij de p,d,q de modelorders aangeeft voor de kortetermijncomponenten van het model en P,D ,Q geeft de modelorders aan voor de seizoenscomponenten van het model.

Om de juiste Box-Jenkins-modellen te identificeren, moeten de modelorders worden bepaald. Theoretisch zouden de modelorders alle gehele waarden kunnen aannemen; in de praktijk zijn ze meestal 0, 1, 2 of 3. Dit levert nog steeds honderden verschillende modellen op om te overwegen – een van de redenen waarom het handmatig identificeren van de modellen zo moeilijk is.

Samenvatting Box-Jenkins methode

Box-Jenkins is een belangrijke voorspellingsmethode die voor bepaalde soorten gegevens nauwkeurigere voorspellingen kan genereren dan andere tijdreeksmethoden. Zoals oorspronkelijk geformuleerd, berustte de identificatie van modellen op een moeilijke, tijdrovende en zeer subjectieve procedure.

Tegenwoordig gebruiken softwarepakketten zoals Forecast Pro automatische algoritmen om zowel te beslissen wanneer Box-Jenkins-modellen moeten worden gebruikt als om automatisch de juiste vorm van het model te identificeren. Deze automatische benaderingen hebben Box-Jenkins-modellen toegankelijk en nuttig gemaakt voor de gemeenschap van zakelijke prognoses.

OVER DE AUTEUR

Eric Stellwagen is de mede-oprichter van Business Forecast Systems, Inc. en de co-auteur van de Forecast Pro-softwareproductlijn. Met meer dan 29 jaar ervaring wordt hij algemeen erkend als een leider op het gebied van business forecasting. Hij heeft uitgebreid overlegd met veel toonaangevende bedrijven. Waaronder Coca-Cola, Procter & Gamble, Merck, Blue Cross Blue Shield, Nabisco, Owens-Corning en Verizon. Dit om hen te helpen hun prognose-uitdagingen aan te pakken. Eric heeft workshops gegeven voor verschillende organisaties, waaronder APICS, het International Institute of Forecasters (IIF), het Institute of Business Forecasting (IBF), het Institute for Operations Research and the Management Sciences (INFORMS) en de University of Tennessee. Hij is momenteel lid van de raad van bestuur van het IIF en de praktijkadviesraad van Foresight: The International Journal of Applied Forecasting.

Originally published at http://www.forecastpro.com/resources/blog/

Inzicht in Pareto (ABC) analyse

Wat is de Pareto (ABC) analyse? In dit artikel bekijken we de analyse om hem beter te leren begrijpen. Lees snel verder!

In de 19e eeuw bracht dr. Wilfredo Pareto, een Italiaanse econoom, de “80/20-regel” in het leven. Dit deed hij toen hij opmerkte dat 80% van de rijkdom van het land in handen was van 20% van de bevolking. Tegenwoordig vinden veel organisaties dat de 80/20-regel (of een vergelijkbare verhouding) van toepassing is op hun producten. 80% van hun inkomsten komt uit 20% van hun producten.

Pareto-analyse, ook wel bekend als ABC-classificatie, is een handige methode voor het classificeren van prognose-items op basis van hun relatieve belang voor de organisatie. Doorgaans worden belangrijke items met een hoog volume gecategoriseerd als type “A”, worden items met een gemiddeld volume gecategoriseerd als type “B” en langzaam bewegende items worden gecategoriseerd als type “C”. Veel organisaties hanteren verschillende procedures voor het opstellen, herzien en bewaken van hun prognoses op basis van de codes.

In dit artikel:

  • Leggen we uit wat Pareto-analyse is;
  • Onderzoeken we de verschillende benaderingen voor het toewijzen van Pareto-codes aan uw prognose-items;
  • Bespreken we hoe de classificaties kunnen worden gebruikt om uw prognoseproces te verbeteren.

Waarom Pareto codes toewijzen?

Pareto codes bieden een raamwerk om verschillende beleidsregels in te stellen voor uw prognose-items op basis van hun belangrijkheid. U kunt bijvoorbeeld besluiten dat:

  • Prognoses voor artikelen van type A altijd worden beoordeeld;
  • Dat prognoses voor artikelen van type B alleen worden beoordeeld als een uitzonderingsrapport een mogelijk probleem aangeeft;
  • Dat prognoses voor artikelen van type C nooit worden beoordeeld.

Er zijn verschillende parameters, zoals doelen voor prognosenauwkeurigheid, veiligheidsvoorraadbeleid en drempels voor uitzonderingsrapporten, die kunnen worden ingesteld op basis van de classificatie van een item.

Pareto-codes bieden ook andere voordelen. De aanwezigheid van een Pareto-code op een rapport geeft direct het belang van een item weer. Wanneer u voorspellingssoftware zoals Forecast Pro gebruikt, kunt u met de mogelijkheid om te filteren en te sorteren op Pareto-codes uw tijd optimaal besteden door u te concentreren op uw ‘big hitters’.

Hoe worden Pareto codes toegewezen?

Veel organisaties baseren Pareto codes op volume (meestal volume per eenheid of dollars).

pareto analyse

De bovenstaande schermafbeelding toont items gerangschikt op volume. Het veld % totaal van geeft het percentage van het totale volume weer dat het artikel vertegenwoordigt. Het veld Rangorde spreekt voor zich.

Er zijn verschillende benaderingen voor het toewijzen van Pareto codes op basis van volume. Forecast Pro ondersteunt drie verschillende manieren: “volume (%)”, “aantal series (#)” en “aantal series (%)”. De eerste stap voor alle drie is het rangschikken van alle items op volume.

Pareto analyse opties forecast pro

Volume (%)

Dit is de methode die het meest overeenkomt met de 80/20-regel. Het is gebaseerd op het cumulatieve volume van elke groep. Als u bijvoorbeeld type A instelt op 80%, type B op 15% en type C op 5%, worden de best gerangschikte items achtereenvolgens toegewezen aan de A-groep totdat hun cumulatieve volume gelijk is aan of groter is dan 80% van het totale volume. De op een na hoogste gerangschikte items worden vervolgens opeenvolgend toegewezen aan de B-groep totdat het cumulatieve volume van de A- en B-items gelijk is aan of groter is dan 95% (80% + 15%). De overige items (5% of minder van het cumulatieve volume) krijgen dan type C toegewezen.

Series Count (#)

Dit stelt u in staat om specifieke nummers van items toe te wijzen aan elke groep. Als u bijvoorbeeld 1000 items heeft en u stelt de A-groep in op 100, de B-groep op 200 en de C-groep op 700, worden de 100 hoogst gerangschikte items toegewezen aan groep A, de volgende 200 items worden toegewezen aan groep B en de overige items worden toegewezen aan groep C.

Series Count (%)

Wijst het gespecificeerde percentage van het totale aantal items aan dat je hebt toe aan elke groep. Als A bijvoorbeeld is ingesteld op 20%, B is ingesteld op 50% en C is ingesteld op 30%, worden de best gerangschikte items achtereenvolgens toegewezen aan de A-groep totdat het aantal A-groepitems gelijk is aan 20% van het totale aantal van artikelen. De op een na hoogste gerangschikte items worden vervolgens opeenvolgend toegewezen aan de B-groep totdat het aantal B-groepitems gelijk is aan 50% van het totale aantal items. De overige items (30% van het totale aantal items) krijgen type C toegewezen.

Een alternatief voor het toewijzen van Pareto codes op basis van volume is het bedenken van een aangepaste classificatie op basis van de waarde die aan het bedrijf wordt verstrekt. U kunt er bijvoorbeeld voor kiezen om artikelen te classificeren op basis van winstgevendheid, strategisch belang of een ander criterium.

Samenvatting Pareto analyse

Pareto analyse is een handig hulpmiddel voor het organiseren en prioriteren van uw prognose-items en het optimaliseren van uw prognoseproces. Het stelt u in staat om te voorkomen dat u kostbare tijd en middelen verspilt door u te concentreren op uw belangrijkste items.

Over de auteur

Eric Stellwagen is de mede-oprichter van Business Forecast Systems, Inc. en de co-auteur van de Forecast Pro-softwareproductlijn. Met meer dan 29 jaar ervaring wordt hij algemeen erkend als een leider op het gebied van business forecasting. Hij heeft uitgebreid overlegd met veel toonaangevende bedrijven. Waaronder Coca-Cola, Procter & Gamble, Merck, Blue Cross Blue Shield, Nabisco, Owens-Corning en Verizon. Dit om hen te helpen hun prognose-uitdagingen aan te pakken. Eric heeft workshops gegeven voor verschillende organisaties, waaronder APICS, het International Institute of Forecasters (IIF), het Institute of Business Forecasting (IBF), het Institute for Operations Research and the Management Sciences (INFORMS) en de University of Tennessee. Hij is momenteel lid van de raad van bestuur van het IIF en de praktijkadviesraad van Foresight: The International Journal of Applied Forecasting.

Originally published at http://www.forecastpro.com/resources/blog/