Wednesday, 15 November 2017

Linjär regression to the rörliga medelvärden och smoothing tekniker


Prognoser genom utjämningstekniker Den här webbplatsen är en del av JavaScript E-labs lärande objekt för beslutsfattande. Annan JavaScript i denna serie kategoriseras under olika tillämpningsområden i avsnittet MENU på den här sidan. En tidsserie är en följd av observationer som beställs i tid. Inherent i insamlingen av data som tagits över tiden är någon form av slumpmässig variation. Det finns metoder för att minska avbrytandet av effekten på grund av slumpmässig variation. Bredt använda tekniker är utjämning. Dessa tekniker, när de tillämpas korrekt, avslöjar tydligare de underliggande trenderna. Ange tidsserierna Row-wise i följd, från början till vänster och parametrarna, och klicka sedan på knappen Beräkna för att få fram en prognos för en period framåt. Blanka rutor ingår inte i beräkningarna utan nollor är. När du matar in data för att flytta från cell till cell i datmatrisen använder du inte knappen Tab eller pilar in. Funktioner av tidsserier, som kan avslöjas genom att granska dess graf. med de prognostiserade värdena och residualbeteendet, förutsatt prognosmodellering. Flyttande medelvärden: Flytta medelvärden rang bland de mest populära teknikerna för förbehandling av tidsserier. De används för att filtrera slumpmässigt vitt brus från data, för att göra tidsserierna mjukare eller till och med för att betona vissa informationskomponenter i tidsserierna. Exponentiell utjämning: Detta är ett mycket populärt schema för att producera en slät Time Series. Medan i rörliga medelvärden viktas de senaste observationerna, exponentiell utjämning tilldelar exponentiellt minskande vikter som observationen blir äldre. Med andra ord ges de senaste observationerna relativt större vikt vid prognosen än de äldre observationerna. Dubbel exponentiell utjämning är bättre vid hantering av trender. Trippel exponentiell utjämning är bättre vid hantering av paraboltrender. Ett exponentiellt vägat glidande medelvärde med en utjämningskonstant a. motsvarar ungefär ett enkelt rörligt medelvärde av längd (dvs period) n, där a och n är relaterade av: a 2 (n1) ORn (2-a) a. Således skulle exempelvis ett exponentiellt vägt glidmedel med en utjämningskonstant lika med 0,1 motsvara ungefär ett 19 dagars glidande medelvärde. Och ett 40-dagars enkelt glidande medelvärde skulle motsvara ungefär ett exponentiellt vägt glidmedel med en utjämningskonstant lika med 0,04878. Håller linjär exponentiell utjämning: Antag att tidsserierna är säsongsbetonade men visar visningstendens. Holts metod beräknar både nuvarande nivå och nuvarande trend. Observera att det enkla glidande medlet är speciellt fall av exponentiell utjämning genom att ställa in perioden för glidande medelvärde till heltalet av (2-alfa) alfa. För de flesta företagsdata är en Alpha-parameter som är mindre än 0,40 ofta effektiv. Man kan emellertid utföra en nätverkssökning av parameterutrymmet, med 0,1 till 0,9, med steg om 0,1. Då har den bästa alfas det minsta genomsnittliga absoluta felet (MA-fel). Hur man jämför flera utjämningsmetoder: Även om det finns numeriska indikatorer för bedömning av prognosteknikens noggrannhet, är det mest använda sättet att använda en visuell jämförelse av flera prognoser för att bedöma deras noggrannhet och välja mellan olika prognosmetoder. I detta tillvägagångssätt måste man plotta (med hjälp av exempelvis Excel) på samma graf de ursprungliga värdena för en tidsserievariabel och de förutspådda värdena från flera olika prognosmetoder, vilket underlättar en visuell jämförelse. Du kanske gillar att använda tidigare prognoser med utjämningstekniker JavaScript för att få tidigare prognosvärden baserade på utjämningstekniker som endast använder en parameter. Holt - och Winters-metoderna använder sig av två respektive tre parametrar, därför är det inte en lätt uppgift att välja de optimala eller till och med nära optimala värden genom försök och fel för parametrarna. Den enskilda exponentiella utjämningen betonar det korta perspektivet som ställer nivån till den sista observationen och baseras på villkoret att det inte finns någon trend. Den linjära regressionen, som passar en minsta kvadrera linje till historiska data (eller transformerade historiska data), representerar det långa intervallet, vilket är konditionerat för den grundläggande trenden. Hålen linjär exponentiell utjämning fångar information om den senaste trenden. Parametrarna i Holts-modellen är nivåparametrar som bör minskas när mängden datavariation är stor och trenderparametern bör ökas om den senaste trendriktningen stöds av orsaksfaktorerna. Kortsiktiga prognoser: Observera att varje JavaScript på denna sida ger en enstegs prognos. För att få en tvåstegs-prognos. Lägg helt enkelt till det prognostiserade värdet till slutet av din tidsseriedata och klicka sedan på samma Calculate-knapp. Du kan upprepa denna process några gånger för att få de nödvändiga kortsiktiga prognoserna. Möjliggörande av data tar bort slumpmässig variation och visar trender och cykliska komponenter. Inhämtande i insamlingen av data som tagits över tiden är någon form av slumpmässig variation. Det finns metoder för att minska avbrytandet av effekten på grund av slumpmässig variation. En ofta använd teknik inom industrin är utjämning. Denna teknik, när den tillämpas korrekt, visar tydligare den underliggande trenden, säsongs - och cykliska komponenter. Det finns två olika grupper av utjämningsmetoder. Medelvärden Metoder Exponentiella utjämningsmetoder Med medelvärden är det enklaste sättet att släta data. Vi ska först undersöka några medelvärden, till exempel det enkla genomsnittet av alla tidigare data. En lagerförare vill veta hur mycket en typisk leverantör levererar i 1000 dollar-enheter. Heshe tar slumpmässigt ett urval av 12 leverantörer med följande resultat: Beräknat medelvärde eller medelvärde av data 10. Chefen bestämmer sig för att använda detta som uppskattning av utgifter för en typisk leverantör. Är detta en bra eller dålig uppskattning Medelkvadratfel är ett sätt att bedöma hur bra en modell är Vi ska beräkna det genomsnittliga kvadratfelet. Det felaktiga beloppet använts minus den beräknade mängden. Felet kvadrerade är felet ovan, kvadrerat. SSE är summan av kvadrerade fel. MSE är medelvärdet av de kvadratiska felen. MSE-resultat till exempel Resultaten är: Fel och kvadrater Fel Uppskattningen 10 Frågan uppstår: kan vi använda medelvärdet för att prognostisera inkomst om vi misstänker en trend En titt på diagrammet nedan visar tydligt att vi inte borde göra det här. Genomsnittet väger alla tidigare observationer lika Sammanfattningsvis säger vi att Det enkla genomsnittet eller medelvärdet av alla tidigare observationer är enbart en användbar uppskattning för prognoser när det inte finns några trender. Om det finns trender, använd olika uppskattningar som tar hänsyn till trenden. Medeltalet väger alla tidigare observationer lika. Medelvärdet av värdena 3, 4, 5 är till exempel 4. Vi vet självklart att ett medel beräknas genom att lägga till alla värden och dela summan med antalet värden. Ett annat sätt att beräkna medelvärdet är att lägga till varje värde dividerat med antalet värden eller 33 43 53 1 1.3333 1.6667 4. Multiplikatorn 13 kallas vikten. Generellt: bar frac summa vänster (frac right) x1 left (frac right) x2,. ,, vänster (frac höger) xn. De (vänstra (frac-höger)) är vikterna och de räknas naturligtvis till 1.3. Förstå prognosnivåer och metoder Du kan generera både detaljprognoser och sammanfattningar (produktlinje) prognoser som speglar produktbehovsmönster. Systemet analyserar tidigare försäljning för att beräkna prognoser genom att använda 12 prognosmetoder. Prognoserna innehåller detaljerad information på objektnivå och högre nivåinformation om en filial eller företaget som helhet. 3.1 Prognos för prestationsutvärderingskriterier Beroende på valet av bearbetningsalternativ och trender och mönster i försäljningsdata, utförs vissa prognosmetoder bättre än andra för en given historisk dataset. En prognosmetod som är lämplig för en produkt kanske inte är lämplig för en annan produkt. Det kan hända att en prognosmetod som ger goda resultat i ett skede av en produkts livscykel är lämplig under hela livscykeln. Du kan välja mellan två metoder för att utvärdera nuvarande prestanda för prognosmetoderna: Procent av noggrannhet (POA). Medel absolut avvikelse (MAD). Båda dessa prestationsbedömningsmetoder kräver historiska försäljningsdata under en period som du anger. Denna period kallas en uthållningsperiod eller period med bästa passform. Uppgifterna under denna period används som utgångspunkt för att rekommendera vilken prognosmetod som ska användas vid nästa prognosprojektion. Denna rekommendation är specifik för varje produkt och kan ändras från en prognosproduktion till nästa. 3.1.1 Bästa passform Systemet rekommenderar den bästa anpassningsprognosen genom att använda de valda prognosmetoderna till tidigare försäljningsorderhistorik och jämföra prognosimuleringen till den aktuella historiken. När du genererar en bästa anpassningsprognos jämförs systemet faktiska försäljningsorderhistorier med prognoser för en viss tidsperiod och beräknar hur exakt varje olika prognosmetod förutspådde försäljningen. Då rekommenderar systemet att den mest exakta prognosen är den bästa passformen. Denna grafik illustrerar bästa passformsprognoser: Figur 3-1 Bästa passformsprognos Systemet använder denna stegsekvens för att bestämma den bästa passformen: Använd varje specificerad metod för att simulera en prognos för hållbarhetsperioden. Jämför den faktiska försäljningen till de simulerade prognoserna för hållbarhetsperioden. Beräkna POA eller MAD för att bestämma vilken prognosmetod som ligger närmast den tidigare faktiska försäljningen. Systemet använder antingen POA eller MAD, baserat på de behandlingsalternativ som du väljer. Rekommendera en lämplig prognos för POA som är närmast 100 procent (över eller under) eller MAD som är närmast noll. 3.2 Prognosmetoder JD Edwards EnterpriseOne Forecast Management använder 12 metoder för kvantitativ prognostisering och indikerar vilken metod som passar bäst för prognosläget. Detta avsnitt diskuterar: Metod 1: Procent under förra året. Metod 2: Beräknad procentsats under förra året. Metod 3: Förra året till det här året. Metod 4: Flyttande medelvärde. Metod 5: Linjär approximation. Metod 6: Minsta kvadratregression. Metod 7: Tillnärmning av andra graden. Metod 8: Flexibel metod. Metod 9: Viktat rörande medelvärde. Metod 10: Linjär utjämning. Metod 11: Exponentiell utjämning. Metod 12: Exponentiell utjämning med trend och säsonglighet. Ange den metod som du vill använda i behandlingsalternativen för prognosgenereringsprogrammet (R34650). De flesta av dessa metoder ger begränsad kontroll. Exempelvis kan vikten på senaste historiska data eller datumintervallet för historiska data som används i beräkningarna specificeras av dig. Exemplen i guiden anger beräkningsförfarandet för var och en av de tillgängliga prognosmetoderna, med en identisk uppsättning historiska data. Metodsexemplen i guiden använder en del eller alla dessa datasatser, vilket är historiska data från de senaste två åren. Prognosprojektionen går in i nästa år. Försäljningshistorikdata är stabila med små säsongsökningar i juli och december. Detta mönster är karakteristiskt för en mogen produkt som kan närma sig föryngring. 3.2.1 Metod 1: Procent under förra året Denna metod använder Formuläret Procent Över fjolårets formel för att multiplicera varje prognosperiod med angiven procentuell ökning eller minskning. För att kunna förutse efterfrågan kräver denna metod antalet perioder för bästa passform plus ett års försäljningshistoria. Denna metod är användbar för att prognostisera efterfrågan på säsongsvaror med tillväxt eller minskning. 3.2.1.1 Exempel: Metod 1: Procent under fjolåret Procenten över fjolårets formel multiplicerar försäljningsdata från föregående år med en faktor du anger och sedan projekt som resulterar under nästa år. Denna metod kan vara användbar vid budgetering för att simulera påverkan av en viss tillväxt eller när försäljningshistoriken har en betydande säsongskomponent. Prognosspecifikationer: Multiplikationsfaktor. Ange till exempel 110 i bearbetningsalternativet för att öka de tidigare årens försäljningshistorikdata med 10 procent. Erforderlig försäljningshistorik: Ett år för beräkning av prognosen plus antal tidsperioder som krävs för att utvärdera prognosprestandan (perioder med bästa passform) som du anger. Denna tabell är historia som används i prognosberäkningen: Februari-prognosen motsvarar 117 gånger 1,1 128,7 avrundad till 129. Marsprognosen motsvarar 115 gånger 1,1 126,5 avrundad till 127. 3.2.2 Metod 2: Beräknad procentsats under förra året Denna metod använder beräknad procentsats över Förra året formel för att jämföra den tidigare försäljningen av specificerade perioder till försäljning från samma perioder föregående år. Systemet bestämmer en procentuell ökning eller minskning, och multiplicerar sedan varje period med procentandelen för att bestämma prognosen. För att kunna förutse efterfrågan kräver denna metod antalet perioder med orderorderhistorik plus ett års försäljningshistorik. Denna metod är användbar för att förutspå kortfristig efterfrågan på säsongsvaror med tillväxt eller nedgång. 3.2.2.1 Exempel: Metod 2: Beräknad procentsats under förra året Beräknad procentsats Över fjolårets formel multiplicerar försäljningsdata från föregående år med en faktor som beräknas av systemet och sedan projekterar det resultatet för nästa år. Den här metoden kan vara användbar för att påvisa inverkan på att förlänga den senaste tillväxttakten för en produkt till nästa år samtidigt som ett säsongsmönster som finns i försäljningshistoriken bevaras. Prognosspecifikationer: Omsättning av försäljningshistoria som ska användas vid beräkning av tillväxten. Till exempel, specificera n är lika med 4 i bearbetningsalternativet för att jämföra försäljningshistorik för de senaste fyra perioderna till samma fyra perioder föregående år. Använd det beräknade förhållandet för att göra projiceringen för nästa år. Erforderlig försäljningshistoria: Ett år för beräkning av prognosen plus antal tidsperioder som krävs för att utvärdera prognosprestandan (perioder med bästa passform). Denna tabell är historia som används i prognosberäkningen, givet n 4: Februari-prognosen motsvarar 117 gånger 0,9766 114,26 avrundad till 114. Marsprognosen motsvarar 115 gånger 0,9766 112,31 avrundad till 112. 3.2.3 Metod 3: Förra året till i år Denna metod använder Förra årets försäljning för nästa års prognos. För att prognostisera efterfrågan kräver denna metod det antal perioder som passar bäst, plus ett års orderorderhistorik. Denna metod är användbar för att förutse efterfrågan på mogna produkter med efterfrågan på efterfrågan eller säsongens efterfrågan utan en trend. 3.2.3.1 Exempel: Metod 3: Förra året till det här året Förra året till årets formel kopieras försäljningsdata från föregående år till nästa år. Denna metod kan vara användbar vid budgetering för att simulera försäljningen på nuvarande nivå. Produkten är mogen och har ingen trend på lång sikt, men det kan finnas ett betydande säsongsmönster. Prognosspecifikationer: Ingen. Erforderlig försäljningshistoria: Ett år för beräkning av prognosen plus antal tidsperioder som krävs för att utvärdera prognosprestandan (perioder med bästa passform). Denna tabell är historia som används i prognosberäkningen: Januari-prognosen motsvarar januari i fjol med ett prognosvärde på 128. Februari-prognosen motsvarar februari förra året med ett prognosvärde på 117. Marsprognosen är samma som i mars i fjol med ett prognostiskt värde av 115. 3.2.4 Metod 4: Flyttande medelvärde Med denna metod används den rörliga genomsnittsformeln för att medge det angivna antalet perioder för att projicera nästa period. Du bör räkna om det ofta (månadsvis eller åtminstone kvartalsvis) för att återspegla förändrad efterfråganivå. För att prognostisera efterfrågan kräver denna metod det antal perioder som passar bäst, plus antalet perioder med orderorderhistorik. Denna metod är användbar för att prognostisera efterfrågan på mogna produkter utan en trend. 3.2.4.1 Exempel: Metod 4: Flytta genomsnittligt rörligt medelvärde (MA) är en populär metod för att medelvärda resultaten av den senaste försäljningshistoriken för att bestämma en prognos på kort sikt. MA prognosmetoden ligger bakom trenderna. Prognosfel och systematiska fel uppstår när produktförsäljningshistoriken uppvisar stark trend eller säsongsmönster. Denna metod fungerar bättre för kortvariga prognoser för mogna produkter än för produkter som ligger i livscykelns tillväxt eller fördjupning. Prognosspecifikationer: n är det antal försäljningsperioder som ska användas i prognosberäkningen. Ange till exempel n 4 i bearbetningsalternativet för att använda de senaste fyra perioderna som utgångspunkt för projiceringen till nästa tidsperiod. Ett stort värde för n (som 12) kräver mer försäljningshistoria. Det resulterar i en stabil prognos, men är långsamt att känna igen skift i försäljningsnivån. Omvänt är ett litet värde för n (som 3) snabbare att svara på förändringar i försäljningsnivån, men prognosen kan fluktuera så mycket att produktionen inte kan svara på variationerna. Erforderlig försäljningshistorik: n plus antal tidsperioder som krävs för att utvärdera prognosprestandan (perioder med bästa passform). Denna tabell är historia som används i prognosberäkningen: Februari-prognosen motsvarar (114 119 137 125) 4 123,75 avrundad till 124. Marsprognosen är lika med (119 137 125 124) 4 126.25 avrundad till 126. 3.2.5 Metod 5: Linjär approximation Denna metod använder den linjära approximationsformeln för att beräkna en trend från antalet perioder av orderorderhistorik och att projicera denna trend till prognosen. Du bör omräkna trenden månadsvis för att upptäcka förändringar i trender. Denna metod kräver antalet perioder med bäst passform plus antal specificerade perioder av orderorderhistorik. Denna metod är användbar för att prognostisera efterfrågan på nya produkter eller produkter med konsekventa positiva eller negativa trender som inte beror på säsongsvariationer. 3.2.5.1 Exempel: Metod 5: Linjär approximation Linjär approximation beräknar en trend som baseras på två försäljningshistoriska datapunkter. Dessa två punkter definierar en rak trendlinje som projiceras in i framtiden. Använd denna metod med försiktighet, eftersom långdistansprognoser utnyttjas av små förändringar på bara två datapunkter. Prognosspecifikationer: n motsvarar datapunktet i försäljningshistorik som jämförs med den senaste datapunkten för att identifiera en trend. Ange till exempel n 4 för att använda skillnaden mellan december (senaste uppgifterna) och augusti (fyra perioder före december) som grund för beräkning av trenden. Minsta obligatoriska försäljningshistorik: n plus 1 plus antal tidsperioder som krävs för att utvärdera prognosprestandan (perioder med bästa passform). Denna tabell är historia som används i prognosberäkningen: Januariprognos december förra året 1 (Trend), vilket är 137 (1 gånger 2) 139. Februari prognos december förra året 1 (Trend) vilket är 137 (2 gånger 2) 141. Marsprognos december förra året 1 (Trend), som är lika med 137 (3 gånger 2) 143. 3.2.6 Metod 6: Minsta kvadreregression Metoden för minsta kvadratregression (LSR) härleder en ekvation som beskriver ett raklinjeläge mellan historiska försäljningsdata och tidens gång. LSR passar en linje till det valda datamängden så att summan av kvadraterna för skillnaderna mellan de faktiska försäljningsdatapunkterna och regressionslinjen minimeras. Prognosen är en projicering av denna raka linje i framtiden. Denna metod kräver försäljningsdatahistorik för den period som representeras av antalet perioder som passar bäst och det angivna antalet historiska datoperioder. Minimikravet är två historiska datapunkter. Denna metod är användbar för att förutse efterfrågan när en linjär trend är i data. 3.2.6.1 Exempel: Metod 6: Minsta kvadratregression Linjär regression eller LAST-kvadratregression (LRR) är den mest populära metoden för att identifiera en linjär trend i historiska försäljningsdata. Metoden beräknar värdena för a och b som ska användas i formeln: Denna ekvation beskriver en rak linje, där Y representerar försäljning och X representerar tid. Linjär regression är långsam att känna igen vändpunkter och stegfunktionsskift i efterfrågan. Linjär regression passar en rak linje till data, även om data är säsongsbetonad eller bättre beskrivs av en kurva. När försäljningshistorikdata följer en kurva eller har ett starkt säsongsmönster uppträder prognosfel och systematiska fel. Prognosspecifikationer: n är lika med försäljningshistorikperioderna som kommer att användas vid beräkning av värdena för a och b. Ange till exempel n 4 för att använda historiken från september till december som grund för beräkningarna. När data är tillgänglig skulle en större n (såsom n 24) normalt användas. LSR definierar en rad för så få som två datapunkter. För detta exempel valdes ett litet värde för n (n 4) för att minska de manuella beräkningarna som krävs för att verifiera resultaten. Minimikrav på försäljningshistorik: n perioder plus antal tidsperioder som krävs för att utvärdera prognosprestandan (perioder med bästa passform). Denna tabell är historia som används i prognosberäkningen: Marsprognosen motsvarar 119,5 (7 gånger 2,3) 135,6 avrundad till 136. 3.2.7 Metod 7: Andra grader Approximation För att projicera prognosen använder denna metod andra grader approximationsformeln för att plotta en kurva Det är baserat på antalet försäljningsperioder. Denna metod kräver antalet perioder som passar bäst, plus antalet perioder av orderorderhistorikstider tre. Denna metod är inte användbar för att prognostisera efterfrågan på en långsiktig period. 3.2.7.1 Exempel: Metod 7: Andra grader approximation Linjär regression bestämmer värdena för a och b i prognosformeln Y a b X med målet att anpassa en rak linje till försäljningshistorikdata. Andra grader Approximation är liknande, men den här metoden bestämmer värdena för a, b och c i den här prognosformeln: Y a b X c X 2 Syftet med denna metod är att passa en kurva till försäljningshistorikdata. Denna metod är användbar när en produkt är i övergången mellan livscykelstadier. Till exempel, när en ny produkt flyttar från introduktion till tillväxtstadier, kan försäljningsutvecklingen accelereras. På grund av den andra orderperioden kan prognosen snabbt närma sig oändligheten eller släppa till noll (beroende på om koefficienten c är positiv eller negativ). Denna metod är endast användbar på kort sikt. Prognosspecifikationer: Formeln hitta a, b och c för att passa en kurva till exakt tre punkter. Du anger n, antalet tidsperioder för data som ackumuleras i var och en av de tre punkterna. I detta exempel, n 3. Faktiska försäljningsdata för april till juni kombineras till första punkten, Q1. Juli till september läggs samman för att skapa Q2 och oktober till december summa till Q3. Kurvan är monterad på de tre värdena Q1, Q2 och Q3. Erforderlig försäljningshistorik: 3 gånger n perioder för beräkning av prognosen plus antal tidsperioder som krävs för att utvärdera prognosens prestanda (perioder med bästa passform). Denna tabell är historia som används i prognosberäkningen: Q0 (Jan) (Feb) (Mar) Q1 (Apr) (Maj) (Jun), vilket motsvarar 125 122 137 384 Q2 (Jul) (Aug) (Sep) vilket är lika med 140 129 131 400 Q3 (okt) (nov) (dec) vilket motsvarar 114 119 137 370 Nästa steg innebär att de tre koefficienterna a, b och c används för att användas i prognosformeln Y ab X c X 2. Q1, Q2 och Q3 presenteras på grafiken, där tiden är planerad på den horisontella axeln. Q1 representerar total historisk försäljning för april, maj och juni och är planerad till X 1 Q2 motsvarar juli till september Q3 motsvarar oktober till december och Q4 representerar januari till mars. Figur 3-2 Plottning Q1, Q2, Q3 och Q4 för approximering av andra grader Tre ekvationer beskriver de tre punkterna på diagrammet: (1) Q1, Q2, Q3 och Q4 för andra graders approximation: Figur 3-2 en bX cX 2 där X 1 (Q1 abc) (2) Q2 en bX cX2 där X2 (Q2 a2b4c) (3) Q3 en bX cX2 där X3 (Q3 a 3b 9c) Lös de tre ekvationerna samtidigt för att hitta b, a och c: Subtrahera ekvation 1 (1) från ekvation 2 (2) och lösa för b: (2) ndash (1) Q2 ndash Q1 b 3c b (Q2 ndash Q1) ndash 3c Ersätt denna ekvation för b till ekvation (3): (3) Q3 a 3 (Q2 ndash Q1) ndash 3c 9c a Q3 ndash 3 (Q2 ndash Q1) Äntligen ersätt dessa ekvationer för a och b till ekvation (1): (1) Q3 ndash 3 (Q2 ndash Q1) (Q2 ndash Q1) ndash 3c c Q1c (Q3 ndash Q2) (Q1 ndash Q2) 2 Den andra graden approximationsmetoden beräknar a, b och c enligt följande: en Q3 ndash 3 (Q2 ndash Q1 ) 370 ndash 3 (400 ndash 384) 370 ndash 3 (16) 322 b (Q2 ndash Q1) ndash3c (400 nda sh 384) ndash (3 gånger ndash23) 16 69 85 c (Q3 ndash Q2) (Q1 ndash Q2) 2 (370 ndash 400) (384 ndash 400) 2 ndash23 Detta är en beräkning av approximationsprognos för andra graden: Y a bX cX 2 322 85X (ndash23) (X 2) När X 4, Q4 322 340 ndash 368 294. Prognosen motsvarar 294 3 98 per period. När X 5, Q5 322 425 ndash 575 172. Prognosen är 172 3 58,33 avrundad till 57 per period. När X 6, Q6 322 510 ndash 828 4. Prognosen är lika med 4 3 1,33 avrundad till 1 per period. Detta är prognosen för nästa år, förra året till det här året: 3.2.8 Metod 8: Flexibel metod Med den här metoden kan du välja det passande antal perioder av orderorderhistorik som börjar n månader före prognosens startdatum och till tillämpa en procentuell ökning eller minskning multiplikationsfaktor för att ändra prognosen. Denna metod liknar Metod 1, Procent över förra året, förutom att du kan ange antalet perioder som du använder som bas. Beroende på vad du väljer som n kräver denna metod perioder som passar bäst och antalet perioder av försäljningsdata som anges. Denna metod är användbar för att förutse efterfrågan på en planerad trend. 3.2.8.1 Exempel: Metod 8: Flexibel metod Den flexibla metoden (Procent över n månader före) liknar Metod 1, Procent över förra året. Båda metoderna multiplicerar försäljningsdata från en tidigare tidsperiod med en faktor som specificeras av dig och sedan projekterar det resultatet i framtiden. I Procenten över senaste årmetoden är projiceringen baserad på data från samma period föregående år. Du kan också använda den flexibla metoden för att ange en tidsperiod, annan än samma period det senaste året, för att använda som underlag för beräkningarna. Multiplikationsfaktor. Ange till exempel 110 i bearbetningsalternativet för att öka tidigare försäljningshistorikdata med 10 procent. Basperiod Till exempel medför n 4 att den första prognosen baseras på försäljningsdata i september förra året. Minimikrav på försäljningshistorik: Antalet perioder tillbaka till basperioden plus antal tidsperioder som krävs för att utvärdera prognosprestandan (perioder med bästa passform). Den här tabellen är historia som används i prognosberäkningen: 3.2.9 Metod 9: Viktad Flyttande Medeltal Den viktade Flytta genomsnittliga formeln liknar Metod 4, Flyttande medelformel, eftersom den genomsnittlig försäljningshistorik för föregående månader för att projicera nästa månads försäljningshistorik. Med denna formel kan du dock tilldela vikter för varje tidigare period. Denna metod kräver antalet viktiga perioder som valts plus antal perioder som passar bäst i data. På samma sätt som rörande medelvärde ligger denna metod bakom efterfrågan trender, så den här metoden rekommenderas inte för produkter med starka trender eller säsongsmässiga egenskaper. Denna metod är användbar för att prognostisera efterfrågan på mogna produkter med en efterfrågan som är relativt nivå. 3.2.9.1 Exempel: Metod 9: Vägt rörlig medelvärde Den viktade rörliga genomsnittsmetoden (WMA) liknar Metod 4, Moving Average (MA). Du kan dock tilldela ojämna vikter till historiska data när du använder WMA. Metoden beräknar ett vägt genomsnitt av den senaste försäljningshistoriken för att komma fram till en prognos på kort sikt. Nyare data tilldelas vanligtvis en större vikt än äldre data, så WMA är mer mottaglig för skift i försäljningsnivån. Emellertid uppstår prognoser och systematiska fel när produktförsäljningshistoriken uppvisar starka trender eller säsongsmönster. Denna metod fungerar bättre för korta prognoser för mogna produkter än för produkter i livscykelns tillväxt eller fördjupning. Antalet försäljningshistorikperioder (n) som ska användas i prognosberäkningen. Ange till exempel n 4 i bearbetningsalternativet för att använda de senaste fyra perioderna som utgångspunkt för projiceringen till nästa tidsperiod. Ett stort värde för n (som 12) kräver mer försäljningshistoria. Ett sådant värde ger en stabil prognos, men det är långsamt att känna igen skift i försäljningsnivån. Omvänt svarar ett litet värde för n (som 3) snabbare till förändringar i försäljningsnivån, men prognosen kan fluktuera så mycket att produktionen inte kan svara på variationerna. Det totala antalet perioder för behandlingsalternativet rdquo14 - perioder till includerdquo bör inte överstiga 12 månader. Den vikt som tilldelas var och en av de historiska dataperioderna. De tilldelade vikterna måste uppgå till 1,00. Till exempel när n 4 tilldelar vikter av 0,50, 0,25, 0,15 och 0,10 med de senaste data som tar emot största vikt. Minimikrav på försäljningshistorik: n plus antal tidsperioder som krävs för att utvärdera prognosens prestanda (perioder med bästa passform). Denna tabell är historia som används i prognosberäkningen: Januari-prognosen motsvarar (131 gånger 0,10) (114 gånger 0,15) (119 gånger 0,25) (137 gånger 0,50) (0,10 0,15 0,25 0,50) 128,45 avrundad till 128. Februari-prognosen motsvarar (114 gånger 0,10) (119 gånger 0,15) (128 gånger 0,25) (128 gånger 0,25) (128 gånger 0,50) 1 128,45 avrundad till 128. 3.2.10 Metod 10: Linjär utjämning Denna metod beräknar ett vägt genomsnitt av tidigare försäljningsdata. I beräkningen använder denna metod antalet perioder av orderorderhistorik (från 1 till 12) som anges i behandlingsalternativet. Systemet använder en matematisk progression för att väga data i intervallet från den första (minsta vikten) till den slutliga (mest vikt). Då projicerar systemet denna information till varje period i prognosen. Denna metod kräver att månaderna bäst passar plus försäljningsorderhistoriken för antalet perioder som anges i bearbetningsalternativet. 3.2.10.1 Exempel: Metod 10: Linjär utjämning Denna metod liknar Metod 9, WMA. I stället för att godtyckligt tilldela vikter till historiska data används en formel för att tilldela vikter som faller linjärt och summan till 1,00. Metoden beräknar sedan ett vägt genomsnitt av den senaste försäljningshistoriken för att komma fram till en prognos på kort sikt. Liksom alla linjära glidande medelprognostekniker förekommer prognosfel och systematiska fel när produktförsäljningshistoriken uppvisar stark trend eller säsongsmönster. Denna metod fungerar bättre för korta prognoser för mogna produkter än för produkter i livscykelns tillväxt eller fördjupning. n motsvarar antalet försäljningsperioder som ska användas i prognosberäkningen. For example, specify n equals 4 in the processing option to use the most recent four periods as the basis for the projection into the next time period. The system automatically assigns the weights to the historical data that decline linearly and sum to 1.00. For example, when n equals 4, the system assigns weights of 0.4, 0.3, 0.2, and 0.1, with the most recent data receiving the greatest weight. Minimum required sales history: n plus the number of time periods that are required for evaluating the forecast performance (periods of best fit). This table is history used in the forecast calculation: 3.2.11 Method 11: Exponential Smoothing This method calculates a smoothed average, which becomes an estimate representing the general level of sales over the selected historical data periods. This method requires sales data history for the time period that is represented by the number of periods best fit plus the number of historical data periods that are specified. The minimum requirement is two historical data periods. This method is useful to forecast demand when no linear trend is in the data. 3.2.11.1 Example: Method 11: Exponential Smoothing This method is similar to Method 10, Linear Smoothing. In Linear Smoothing, the system assigns weights that decline linearly to the historical data. In Exponential Smoothing, the system assigns weights that exponentially decay. The equation for Exponential Smoothing forecasting is: Forecast alpha (Previous Actual Sales) (1 ndashalpha) (Previous Forecast) The forecast is a weighted average of the actual sales from the previous period and the forecast from the previous period. Alpha is the weight that is applied to the actual sales for the previous period. (1 ndash alpha) is the weight that is applied to the forecast for the previous period. Values for alpha range from 0 to 1 and usually fall between 0.1 and 0.4. The sum of the weights is 1.00 (alpha (1 ndash alpha) 1). You should assign a value for the smoothing constant, alpha. If you do not assign a value for the smoothing constant, the system calculates an assumed value that is based on the number of periods of sales history that is specified in the processing option. alpha equals the smoothing constant that is used to calculate the smoothed average for the general level or magnitude of sales. Values for alpha range from 0 to 1. n equals the range of sales history data to include in the calculations. Generally, one year of sales history data is sufficient to estimate the general level of sales. For this example, a small value for n (n 4) was chosen to reduce the manual calculations that are required to verify the results. Exponential Smoothing can generate a forecast that is based on as little as one historical data point. Minimum required sales history: n plus the number of time periods that are required for evaluating the forecast performance (periods of best fit). This table is history used in the forecast calculation: 3.2.12 Method 12: Exponential Smoothing with Trend and Seasonality This method calculates a trend, a seasonal index, and an exponentially smoothed average from the sales order history. The system then applies a projection of the trend to the forecast and adjusts for the seasonal index. This method requires the number of periods best fit plus two years of sales data, and is useful for items that have both trend and seasonality in the forecast. You can enter the alpha and beta factor, or have the system calculate them. Alpha and beta factors are the smoothing constant that the system uses to calculate the smoothed average for the general level or magnitude of sales (alpha) and the trend component of the forecast (beta). 3.2.12.1 Example: Method 12: Exponential Smoothing with Trend and Seasonality This method is similar to Method 11, Exponential Smoothing, in that a smoothed average is calculated. However, Method 12 also includes a term in the forecasting equation to calculate a smoothed trend. The forecast is composed of a smoothed average that is adjusted for a linear trend. When specified in the processing option, the forecast is also adjusted for seasonality. Alpha equals the smoothing constant that is used in calculating the smoothed average for the general level or magnitude of sales. Values for alpha range from 0 to 1. Beta equals the smoothing constant that is used in calculating the smoothed average for the trend component of the forecast. Values for beta range from 0 to 1. Whether a seasonal index is applied to the forecast. Alpha and beta are independent of one another. They do not have to sum to 1.0. Minimum required sales history: One year plus the number of time periods that are required to evaluate the forecast performance (periods of best fit). When two or more years of historical data is available, the system uses two years of data in the calculations. Method 12 uses two Exponential Smoothing equations and one simple average to calculate a smoothed average, a smoothed trend, and a simple average seasonal index. An exponentially smoothed average: An exponentially smoothed trend: A simple average seasonal index: Figure 3-3 Simple Average Seasonal Index The forecast is then calculated by using the results of the three equations: L is the length of seasonality (L equals 12 months or 52 weeks). t is the current time period. m is the number of time periods into the future of the forecast. S is the multiplicative seasonal adjustment factor that is indexed to the appropriate time period. This table lists history used in the forecast calculation: This section provides an overview of Forecast Evaluations and discusses: You can select forecasting methods to generate as many as 12 forecasts for each product. Each forecasting method might create a slightly different projection. When thousands of products are forecast, a subjective decision is impractical regarding which forecast to use in the plans for each product. The system automatically evaluates performance for each forecasting method that you select and for each product that you forecast. You can select between two performance criteria: MAD and POA. MAD is a measure of forecast error. POA is a measure of forecast bias. Both of these performance evaluation techniques require actual sales history data for a period specified by you. The period of recent history used for evaluation is called a holdout period or period of best fit. To measure the performance of a forecasting method, the system: Uses the forecast formulas to simulate a forecast for the historical holdout period. Makes a comparison between the actual sales data and the simulated forecast for the holdout period. When you select multiple forecast methods, this same process occurs for each method. Multiple forecasts are calculated for the holdout period and compared to the known sales history for that same period. The forecasting method that produces the best match (best fit) between the forecast and the actual sales during the holdout period is recommended for use in the plans. This recommendation is specific to each product and might change each time that you generate a forecast. 3.3.1 Mean Absolute Deviation Mean Absolute Deviation (MAD) is the mean (or average) of the absolute values (or magnitude) of the deviations (or errors) between actual and forecast data. MAD is a measure of the average magnitude of errors to expect, given a forecasting method and data history. Because absolute values are used in the calculation, positive errors do not cancel out negative errors. When comparing several forecasting methods, the one with the smallest MAD is the most reliable for that product for that holdout period. When the forecast is unbiased and errors are normally distributed, a simple mathematical relationship exists between MAD and two other common measures of distribution, which are standard deviation and Mean Squared Error. For example: MAD (Sigma (Actual) ndash (Forecast)) n Standard Deviation, (sigma) cong 1.25 MAD Mean Squared Error cong ndashsigma2 This example indicates the calculation of MAD for two of the forecasting methods. This example assumes that you have specified in the processing option that the holdout period length (periods of best fit) is equal to five periods. 3.3.1.1 Method 1: Last Year to This Year This table is history used in the calculation of MAD, given Periods of Best Fit 5: Mean Absolute Deviation equals (2 1 20 10 14) 5 9.4. Based on these two choices, the Moving Average, n 4 method is recommended because it has the smaller MAD, 9.4, for the given holdout period. 3.3.2 Percent of Accuracy Percent of Accuracy (POA) is a measure of forecast bias. When forecasts are consistently too high, inventories accumulate and inventory costs rise. When forecasts are consistently too low, inventories are consumed and customer service declines. A forecast that is 10 units too low, then 8 units too high, then 2 units too high is an unbiased forecast. The positive error of 10 is canceled by negative errors of 8 and 2. (Error) (Actual) ndash (Forecast) When a product can be stored in inventory, and when the forecast is unbiased, a small amount of safety stock can be used to buffer the errors. In this situation, eliminating forecast errors is not as important as generating unbiased forecasts. However, in service industries, the previous situation is viewed as three errors. The service is understaffed in the first period, and then overstaffed for the next two periods. In services, the magnitude of forecast errors is usually more important than is forecast bias. POA (SigmaForecast sales during holdout period) (SigmaActual sales during holdout period) times 100 percent The summation over the holdout period enables positive errors to cancel negative errors. When the total of forecast sales exceeds the total of actual sales, the ratio is greater than 100 percent. Of course, the forecast cannot be more than 100 percent accurate. When a forecast is unbiased, the POA ratio is 100 percent. A 95 percent accuracy rate is more desirable than a 110 percent accurate rate. The POA criterion selects the forecasting method that has a POA ratio that is closest to 100 percent. This example indicates the calculation of POA for two forecasting methods. This example assumes that you have specified in the processing option that the holdout period length (periods of best fit) is equal to five periods. 3.3.2.1 Method 1: Last Year to This Year This table is history used in the calculation of MAD, given Periods of Best Fit 5: 3.4.2 Forecast Accuracy These statistical laws govern forecast accuracy: A long term forecast is less accurate than a short term forecast because the further into the future you project the forecast, the more variables can affect the forecast. A forecast for a product family tends to be more accurate than a forecast for individual members of the product family. Some errors cancel each other as the forecasts for individual items summarize into the group, thus creating a more accurate forecast. 3.4.3 Forecast Considerations You should not rely exclusively on past data to forecast future demands. These circumstances might affect the business, and require you to review and modify the forecast: New products that have no past data. Plans for future sales promotion. Changes in national and international politics. New laws and government regulations. Weather changes and natural disasters. Innovations from competition. You can use long term trend analysis to influence the design of the forecasts: Leading economic indicators. 3.4.4 Forecasting Process You use the Refresh Actuals program (R3465) to copy data from the Sales Order History File table (F42119), the Sales Order Detail File table (F4211), or both, into either the Forecast File table (F3460) or the Forecast Summary File table (F3400), depending on the kind of forecast that you plan to generate. Scripting on this page enhances content navigation, but does not change the content in any way. Forecasting Computer Usage Julie M. Hays University of St. Thomas Journal of Statistics Education Volume 11, Number 1 (2003), ww2.amstat. orgpublicationsjsev11n1datasets. hays. html Copyright copy 2003 by Julie M. Hays, all rights reserved. This text may be freely shared among individuals, but it may not be republished in any medium without express written consent from the author and advance notification of the editor. Key Words: Causal forecasting Model-building Seasonal Variation Simple linear regression Time-series forecasting Transformations. The dataset bestbuy. dat. txt contains actual monthly data on computer usage (Millions of Instructions Per Second, MIPS) and total number of stores from August 1996 to July 2000. Additionally, information on the planned number of stores through December 2001 is available. This dataset can be used to compare time-series forecasting with trend and seasonality components and causal forecasting based on simple linear regression. The simple linear regression model exhibits unequal error variances, suggesting a transformation of the dependent variable. 1. Introduction One of the most prevalent uses of regression analysis in actual business settings is for forecasting. For a summary of some forecasting methods see Armstrong (2001) or Arsham (2002). The bestbuy. dat. txt dataset can be used to demonstrate and discuss both time-series and causal forecasting. Time constraints and the interests and needs of the students determine whether I supply the analyses or have the students perform the analyses. I have used this dataset throughout the semester in an MBA Decision Analyses class. This class is a core requirement for all evening MBA students and covers a range of decision analysis and statistical topics, including regression analysis and forecasting. Most students are required to take an introductory business statistics course prior to this course, so they have had some exposure to statistical topics, but few students have any academic experience with forecasting. Best Buy Co. Inc. (NYSE:BBY), headquartered in Eden Prairie, Minnesota, is the largest volume specialty retailer of consumer electronics, personal computers, entertainment software and appliances. In August of each year, Best Buy purchases mainframe MIPS (Millions of Instructions Per Second, a measure of computing resources) in anticipation of the coming holiday season. Computing resources are needed to track and analyze retail information needed for billing, inventory, and sales. For planning and budgeting purposes they also wish to forecast the number of MIPS needed the following year. Best Buy Corporation actually used this dataset to predict computer usage in order to budget for and purchase an appropriate amount of computing power. However, prior to 2001, Best Buy did not do any statistical analysis of this data. Best Buy only looked at the numbers (they did not even graph the data) and then guessed at the amount of MIPS needed in the coming year. Students are asked to forecast the MIPS needed for December 2000 and December 2001 using the bestbuy. dat. txt dataset. This dataset was obtained from the Best Buy Corporation and contains monthly data on computer usage (MIPS) and total number of stores from August 1996 to July 2000. Additionally, information on the planned number of stores through December 2001 is available. Students can easily understand the seasonality that retail operations experience. Best Buy Corporation has experienced significant growth over the past few years and most students understand that as a firm grows, their need for computing power also increases. Therefore, this dataset can be used to demonstrate time-series forecasting with both a trend and seasonality. This dataset can also be used to demonstrate causal forecasting based on simple linear regression of computer usage and number of stores. The simple linear regression model exhibits unequal error variances, suggesting a transformation of the dependent variable. Finally, a comparison between the time-series model and causal model can be made and discussed with the students. 2. Time Series Forecasting Before I allow the students to begin any numerical analyses, I have the students plot computer usage versus time. I have the students forecast the number of MIPS needed for December 2000 and December 2001 using only the plot of computer usage (MIPS) versus time, Figure 1. The plot clearly shows a trend in MIPS usage with time. Typically, students eyeball the graph and predict MIPS usage of 500 for December 2000 and 600 for December 2001. Figure 1. MIPS vs Time. Students who actually fit a line to the data forecast MIPS usage of 527 for December 2000 and 624 for December 2001 (Figure 2 ). Figure 2. MIPS vs Time. I introduce simple moving average, weighted moving average and exponential smoothing forecasting techniques to the students before they attempt to use these forecasting models to predict future MIPS usage. I also discuss the evaluation of forecasting models using MAD and CFE (explained below). The interested reader can find more detailed discussions of these topics in Stevenson (2002) or at Sparling (2002). Moving Average An n - period moving average is the average value over the previous n time periods. As you move forward in time, the oldest time period is dropped from the analysis. Weighted Moving Average An n - period weighted moving average allows you to place more weight on more recent time periods by weighting those time periods more heavily. Exponential Smoothing The forecast for the next period using exponential smoothing is a smoothing constant, ( 0 1), times the demand in the current period plus (1- smoothing constant) times the forecast for the current period. where F t1 is the forecast for the next time period, F t is the forecast for the current time period, D t is the demand in the current time period, and 0 1 is the smoothing constant. To initiate the forecast, assume F 1 D 1 . Higher values of a place more weight on the more current time periods. Because this model is less intuitive, I usually expand this equation to help the students understand that demand from time periods prior to the current period is included in this model. and where D t-1 is the demand in the previous time period, D t-2 is the demand in the time period before the previous time period, and F t-1 is the forecast in the previous time period, and F t-2 is the forecast in the time period before the previous time period. Because the data storage requirements are considerably less than for the moving average model, this type of model was used extensively in the past. Now, although data storage is not usually an issue, it is typical of real-world business applications because of its historical usage. Mean Absolute Deviation (MAD) The evaluation of forecasting models is based on the desire to produce forecasts that are unbiased and accurate. The Mean Absolute Deviation (MAD) is one common measure of forecast accuracy. Cumulative sum of Forecast Errors (CFE) The Cumulative sum of Forecast Errors (CFE) is a common measure of forecast bias. Better models would have lower MAD and CFE close to zero. After explaining these techniques, I have the students work through the following simple example in class. I give the students the demand profile (Table 1 ) and have them calculate forecasts using a 3-period moving average and exponential smoothing with a smoothing constant of 0.2. I also have them calculate the MAD and CFE for both models. We discuss using the MAD and CFE to determine the best model. I also point out to the students that I have arbitrarily chosen the number of periods for the moving average model and the smoothing constant for the exponential smoothed model. I discuss using MAD and CFE to determine the best choice for these variables. Table 1. In-class forecasting example. All numbers rounded to the nearest hundredth Once the students are familiar with these techniques, I have them estimate MIPS for December 2000 and 2001 using a 3-period moving average and exponential smoothing with a smoothing constant of 0.2 (Figure 3 ). This can be done using Excel, Minitab or any statistics package. The forecast for the 3-period moving average is 463 MIPS and for the exponential smoothed is 450 MIPS. Figure 3. Actual and forecast MIPS. The students can easily see that there is a problem with their forecasts. Although I have told the students that exponential smoothing and moving average forecasting models are only appropriate for stationary data, they dont really understand this until they try to use the technique. This exercise helps the students understand that moving average and exponential smoothing are really only averaging techniques and helps them comprehend the need to account for trends in forecasting. I demonstrate adjusting for trends by using double exponential smoothing. Double exponential smoothing is a modification of simple exponential smoothing that effectively handles linear trends. Good explanations of this technique can be found in Wilson and Keating (2002) or at Group6 (2002). Double Exponential Smoothing where F t1 is the forecast for the next time period, A t is the exponentially smoothed level component in the current period where F t is the forecast for the current time period, D t is the demand in the current time period, and 0 1 is the smoothing constant and T t is the exponentially smoothed trend component in the current period. where 0 1 is the smoothing constant for the trend, T t-1 is the trend in the previous period, and C t is the current trend The forecast for n periods into the future is After I explain this model, I have the students go back and re-estimate their forecast using this model (Figure 4 ). Minitab has these functions built in and will compute the optimal smoothing parameters, and , based on minimizing the sum of squared errors, but any statistics package could be used. Minitab will also compute Mean Absolute Prediction Error (MAPE), Mean Absolute Deviation (MAD), Mean Square Error (MSE) and provides 95 confidence prediction intervals (see Figure 4 ). The forecasts obtained are essentially the same as the forecasts obtained from fitting a line to the data, MIPS usage of 527 for December 2000 and 624 for December 2001. Figure 4. Optimal double exponential smoothed. I ask the students if they are happy with their forecast now or if there is anything else they need to do. I supply a plot of errors versus time for the double exponential smoothed model with the December errors highlighted (Figure 5 ). Most students are aware that retail firms have their highest sales during the Christmas season (December). Therefore, students typically mention seasonality and we discuss the possible ways that we could account for seasonality. Figure 5. Double exponential smoothed model errors. The students usually mention both an additive and multiplicative adjustment for seasonality using all the past data or only some of the past data. Simple explanations of these two techniques can be found in Hanke and Reitsch (1998) or at Nau (2002). In other words, we could compare the forecast for December 1999 to the actual for December 1999 and for the additive model we would add this difference to our forecast for December 2000. Or, for the multiplicative model, we would multiply the forecast for December 2000 by the actual December 1999forecast December 1999. They carry this further and discuss using the data from 1998, 1997, and 1996 to produce an average adjustment. I lead the discussion towards the smoothing techniques we have been discussing and how we could use these types of techniques to come up with seasonal adjustments for our forecasts. I explain that Winter developed just such a technique of triple exponential smoothing. Winters technique basically adds (or multiplies) a smoothed seasonal adjustment to the model, similar to the addition of a smoothed adjustment for a trend in the double exponential smoothed model. The interested reader can find the calculation formulas and explanations of triple exponential smoothing (or Winters method) in Minitab (1998b) or Prins (2002a). I use Minitab to demonstrate Winters model (Figure 6 ) because the calculations for this method are fairly complex and most students only need to have a general understanding of this type of technique. Using Winters model the forecast for December 2000 is 521 MIPS and the forecast for December 2001 is 606 MIPS. I also use this opportunity to mention ARIMA models and direct interested students to resources such as Minitab (1998a) for more information about ARIMA models. Figure 6. Winters Method. 3. Causal Forecasting I supply the students with a plot of computer usage (MIPS) vs. number of stores (Figure 7 ) and again have them forecast computer usage for December 2000 and December 2001. Best Buy believes that they will have 394 stores in December of 2000 and 445 stores in December of 2001. Figure 7. MIPS vs number of stores. Again most students eyeball the graph and use graphical linear extrapolation to arrive at their forecast. They predict usage of 600 MIPS for December 2000 and 800 MIPS for December 2001. I have the students perform a simple linear regression of MIPS on number of stores and produce the residual plot (Figures 8 and 9 ). I use this opportunity to emphasize the usefulness of the residual plot in evaluating the model. I highlight the megaphone shape of the residual plot (the residuals are increasing as the number of stores increases) and explain that this implies that a transformation of the dependent variable is indicated. Figure 8. MIPS vs number of stores. Figure 9. MIPS vs number of stores residual plot. Although I used the Box-Cox procedure (Box and Cox 1964 ) to determine the appropriate transformation, this technique is beyond the scope of this class. Therefore, I just tell the students that the appropriate transformation is square root of MIPS and mention that there are mathematical techniques that can be used to determine the appropriate transformation. I direct interested students to Neter, Kutner, Nachtsheim, and Wasserman (1996) or Prins (2002b) for descriptions of this technique. I have the students re-estimate the regression equation and produce the residual plot for this regression (Figures 10 and 11 ). Although the R 2 is slightly lower, the residuals are now more evenly distributed. Figure 10. Square root MIPS vs number of stores. Figure 11. Square root MIPS vs number of stores residual plot. I also have the students predict computer usage for December 2000 and December 2001 using the fitted equation. If students have difficulty predicting MIPS, because of the square root transformation of MIPS, I explain the calculations in class. The new predictions are 664 MIPS for December 2000 and 977 MIPS for December 2001. Again, an adjustment for seasonality could be made. Although, any of the seasonality adjustments discussed in the previous section could be used here, I usually have the students use an average multiplicative adjustment. This could be done by calculating actualpredicted for all months, averaging these seasonal factors for each particular month and multiplying the resulting seasonal factor by the predicted value. If this is done, the new predictions for December 2000 and December 2001 are 700 MIPS and 1029 MIPS. 4. Comparison of Methods After the students have used the various methods to predict MIPS usage, I have them discuss which method they have most confidence in and why they believe that that model is the best. Several important points can be made here. First, I emphasize that forecasting is a very imperfect science and no technique can perfectly predict the future. The best technique will balance the accuracy needed with the complexity (or cost) of the model. Second, I emphasize the value of plotting the data. One of the best (and easiest) methods to evaluate various models is a visual examination of the data and forecasts that would be produced by the method under consideration. Third, I emphasize the need to account for trends and seasonality if those are present in the data. Moving averages and exponential smoothing are appropriate forecasting methods only if the data are stationary. If there are trends andor seasonalities present, more sophisticated methods should be used. Finally, we discuss the difficulty inherent in finding a causal predictor for most values we wish to predict in business environments. 5. Conclusion The dataset bestbuy. dat. txt can be used to demonstrate both time series and causal forecasting. Analysis of the dataset leads to a discussion and comparison of the positives and negatives of various forecasting methods. 6. Obtaining the Data The file bestbuy. dat. txt contains the raw data. The file bestbuy. txt is a documentation file containing a brief description of the dataset. Appendix - Key to the variables in bestbuy. dat. txt

No comments:

Post a Comment