När du beräknar ett löpande rörligt medelvärde, är det genomsnittligt att placera genomsnittet i mellantidstiden. I föregående exempel beräknade vi genomsnittet av de första 3 tidsperioderna och placerade det bredvid period 3. Vi kunde ha placerat medelvärdet mitt i tidsintervall av tre perioder, det vill säga bredvid period 2. Detta fungerar bra med udda tidsperioder, men inte så bra för jämn tid. Så vart skulle vi placera det första glidande medlet när M 4 Tekniskt sett skulle det rörliga genomsnittet falla vid t 2.5, 3.5. För att undvika detta problem släpper vi MAs med M 2. Således släpper vi de jämnderade värdena Om vi i genomsnitt ett jämnt antal termer behöver vi släta de jämnda värdena Följande tabell visar resultaten med M 4.David, Ja, MapReduce är avsett att fungera på en stor mängd data. Och tanken är att i allmänhet ska kartan och minska funktionerna inte bryr sig om hur många mappers eller hur många reducerare det finns, det är bara optimering. Om du tänker noggrant på den algoritm som jag skrev upp kan du se att det spelar ingen roll vilken mappare får vilka delar av data som finns. Varje inmatningsrekord kommer att vara tillgänglig för varje reducerad operation som behöver den. ndash Joe K Sep 18 12 på 22:30 I bästa av mina förståelse är rörligt medelvärde inte snygga kartor till MapReduce-paradigmet eftersom dess beräkning väsentligen skjuter fönster över sorterade data, medan MR behandlar icke-skärmade intervall av sorterade data. Lösningen jag ser är som följer: a) Att implementera anpassad partitioner för att kunna skapa två olika partitioner i två körningar. I varje körning kommer dina reducerare att få olika dataområden och beräkna glidande medelvärde där det är lämpligt att jag ska försöka illustrera: I första omgången bör data för reduktionsmedel vara: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . här kommer du att cacluate glidande medelvärde för några Qs. I nästa körning bör dina reducerare få data som: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Och caclulate resten av glidande medelvärden. Då måste du sammanställa resultaten. Idé av anpassad partitioner att det kommer att ha två olika sätt att fungera - varje gång dela i lika stora områden men med lite skift. I en pseudokod kommer det att se ut så här. partition (keySHIFT) (MAXKEYnumOfPartitions) där: SHIFT kommer att tas från konfigurationen. MAXKEY maximalt värde för nyckeln. Jag antar för enkelhet att de börjar med noll. RecordReader, IMHO är inte en lösning eftersom den är begränsad till specifik delning och kan inte glida över splitsgränsen. En annan lösning skulle vara att implementera anpassad logik för att dela in data (det är en del av InputFormat). Det kan göras att göra 2 olika bilder, liknar partitioning. Moving Averages: Vad är de Bland de mest populära tekniska indikatorerna används glidande medelvärden för att mäta riktningen för den nuvarande trenden. Varje typ av rörligt medelvärde (vanligtvis skrivet i denna handledning som MA) är ett matematiskt resultat som beräknas genom att medelvärda ett antal tidigare datapunkter. När det är fastställt, blir det resulterande genomsnittet plottat på ett diagram för att låta handlare titta på jämnare data istället för att fokusera på de dagliga prisfluktuationerna som är inneboende på alla finansmarknader. Den enklaste formen av ett glidande medel, lämpligt känt som ett enkelt glidande medelvärde (SMA), beräknas genom att man tar det aritmetiska medelvärdet av en given uppsättning värden. Till exempel för att beräkna ett grundläggande 10 dagars glidande medelvärde skulle du lägga till slutkurserna från de senaste 10 dagarna och sedan dela resultatet med 10. I Figur 1 är summan av priserna under de senaste 10 dagarna (110) dividerat med antalet dagar (10) för att komma fram till 10-dagars genomsnittet. Om en näringsidkare vill se ett 50-dagars medel istället, skulle samma typ av beräkning göras, men det skulle innefatta priserna under de senaste 50 dagarna. Det resulterande genomsnittet under (11) tar hänsyn till de senaste 10 datapunkterna för att ge handlare en uppfattning om hur en tillgång prissätts relativt de senaste 10 dagarna. Kanske du undrar varför tekniska handlare kallar det här verktyget ett glidande medelvärde och inte bara en vanlig medelvärde. Svaret är att när de nya värdena blir tillgängliga måste de äldsta datapunkterna släppas från uppsättningen och nya datapunkter måste komma in för att ersätta dem. Således flyttar datasatsen ständigt för att redogöra för nya data när den blir tillgänglig. Denna beräkningsmetod säkerställer att endast den nuvarande informationen redovisas. I figur 2 flyttas den röda rutan (representerande de senaste 10 datapunkterna) till höger om det nya värdet på 5 och det sista värdet av 15 släpps från beräkningen. Eftersom det relativt lilla värdet på 5 ersätter det höga värdet på 15, förväntar du dig att genomsnittet av datamängden minskar, vilket det gör, i det här fallet från 11 till 10. Vad ser Moving Averages Like när värdena på MA har beräknats, de är plottade på ett diagram och sedan anslutna för att skapa en rörlig genomsnittslinje. Dessa kurvor är vanliga på diagrammen för tekniska handlare, men hur de används kan variera drastiskt (mer om detta senare). Som du kan se i Figur 3 är det möjligt att lägga till mer än ett glidande medelvärde till ett diagram genom att justera antalet tidsperioder som används i beräkningen. Dessa böjda linjer kan tyckas distraherande eller förvirrande först, men du kommer att bli vana vid dem som tiden går vidare. Den röda linjen är helt enkelt genomsnittspriset under de senaste 50 dagarna, medan den blå linjen är genomsnittspriset under de senaste 100 dagarna. Nu när du förstår vad ett rörligt medelvärde är och hur det ser ut, introducerar du en annan typ av rörligt medelvärde och undersöker hur det skiljer sig från det tidigare nämnda enkla glidande medlet. Det enkla glidande medlet är extremt populärt bland handlare, men liksom alla tekniska indikatorer har det kritiker. Många individer hävdar att användbarheten av SMA är begränsad eftersom varje punkt i dataserien är densamma, oavsett var den uppträder i sekvensen. Kritiker hävdar att de senaste uppgifterna är mer signifikanta än de äldre uppgifterna och bör ha större inverkan på slutresultatet. Som svar på denna kritik började näringsidkare lägga större vikt vid de senaste uppgifterna, som sedan har lett till uppfinningen av olika typer av nya medelvärden, varav den mest populära är det exponentiella glidande genomsnittet (EMA). (För vidare läsning, se Grunderna för viktade rörliga medelvärden och vad som är skillnaden mellan en SMA och en EMA) Exponentiell rörlig genomsnitts Det exponentiella glidande medlet är en typ av glidande medelvärde som ger större vikt till de senaste priserna i ett försök att göra det mer responsivt till ny information. Att lära sig den något komplicerade ekvationen för att beräkna en EMA kan vara onödig för många handlare, eftersom nästan alla kartläggningspaket gör beräkningarna för dig. Men för dig matte geeks där ute, här är EMA-ekvationen: När du använder formeln för att beräkna den första punkten hos EMA kan du märka att det inte finns något värde tillgängligt för att använda som tidigare EMA. Detta lilla problem kan lösas genom att börja beräkna med ett enkelt glidande medelvärde och fortsätta med ovanstående formel därifrån. Vi har försett dig med ett provkalkylblad som innehåller verkliga exempel på hur man beräknar både ett enkelt glidande medelvärde och ett exponentiellt rörligt medelvärde. Skillnaden mellan EMA och SMA Nu när du har en bättre förståelse för hur SMA och EMA beräknas, kan vi titta på hur dessa medeltal skiljer sig. Genom att titta på beräkningen av EMA kommer du att märka att större vikt läggs på de senaste datapunkterna, vilket gör det till en typ av vägt genomsnitt. I Figur 5 är antalet tidsperioder som används i varje genomsnitt identiskt (15), men EMA svarar snabbare på de förändrade priserna. Lägg märke till hur EMA har ett högre värde när priset stiger och faller snabbare än SMA när priset sjunker. Denna respons är den främsta anledningen till att många handlare föredrar att använda EMA över SMA. Vad betyder de olika dagarna Medflyttande medelvärden är en helt anpassningsbar indikator, vilket innebär att användaren fritt kan välja vilken tidsram de vill ha när man skapar genomsnittet. De vanligaste tidsperioderna som används i glidande medelvärden är 15, 20, 30, 50, 100 och 200 dagar. Ju kortare tidsintervallet användes för att skapa medelvärdet desto känsligare blir det för prisändringar. Ju längre tidsperiod, desto mindre känslig, eller mer utjämnas, blir medelvärdet. Det finns ingen rätt tidsram att använda när du ställer in dina glidande medelvärden. Det bästa sättet att ta reda på vilket som fungerar bäst för dig är att experimentera med ett antal olika tidsperioder tills du hittar en som passar din strategi. Möjliga medelvärden och centrerade rörliga medelvärden Ett par punkter om säsongsmässigt i en tidsserie bär upprepande, även om de verkar självklara. En är att termen 8220season8221 inte nödvändigtvis hänvisar till årets fyra årstider, som härrör från lutningen av Earth8217s axel. I predictive analytics betyder 8220season8221 ofta just det, för många av de fenomen som vi studerar varierar ihop med vårens framsteg i vinter: försäljning av vinter - eller sommarutrustning, förekomsten av vissa utbredda sjukdomar, väderhändelser orsakade av platsen för jetström och förändringar i temperaturen på vattnet i östra Stilla havet, och så vidare. Likaså kan händelser som förekommer regelbundet fungera som meteorologiska årstider, även om de bara har en tuff anslutning till solstickorna och equinoxerna. Åtta timmars skift på sjukhus och fabriker uttrycks ofta i förekomsten av intag och utgifter för energi där, en säsong är åtta timmar och årstiderna cyklar varje dag, inte varje år. Förfallodagar för skatter signalerar början av en översvämning av dollar till kommunala, statliga och federala skattemyndigheter där, kan säsongen vara ett år lång (personlig inkomstskatt), sex månader (fastighetsskatt i många stater) kvartalsvis (många företagsskatter ), och så vidare. It8217 är lite konstigt att vi har ordet 8220season8221 att referera generellt till den regelbundet återkommande tidsperioden, men ingen generell term för tidsperioden under vilken en fullständig årstidsändring inträffar. 8220Cycle8221 är möjlig, men i analyser och prognoser brukar begreppet normalt innebära en obestämd längd, såsom en konjunkturcykel. I avsaknad av en bättre term, använde I8217ve 8220enomfattande period8221 i detta och efterföljande kapitel. Detta är bara terminologiskt musing. De sätt vi identifierar årstider och den tidsperiod under vilken årstiderna har verkliga, om det är ofta mindre, konsekvenser för hur vi mäter deras effekter. I följande avsnitt diskuteras hur vissa analytiker varierar hur de beräknar glidande medelvärden beroende på om antalet årstider är udda eller jämnt. Använda rörliga medelvärden istället för enkla medelvärden Anta att en storstad överväger omfördelningen av sin trafikpolis för att bättre ta itu med förekomsten av körning medan nedsatt, vilket staden anser har ökat. För fyra veckor sedan trädde ny lagstiftning i kraft, vilket legaliserar innehav och fritidsbruk av marijuana. Sedan dess verkar det dagliga antalet trafikanställningar för DWI vara trending. Komplicerande är det faktum att antalet anhållanden verkar spika på fredagar och lördagar. För att hjälpa till att planera för arbetskraftsbehov i framtiden, gillar du att förutse vilken underliggande trend som etableras. You8217d gillar också att utnyttja dina resurser för att ta hänsyn till vilken helgrelaterad säsong som8217s äger rum. Figur 5.9 har relevanta uppgifter som du måste arbeta med. Figur 5.9 Med denna dataset utgör varje dag i veckan en säsong. Även genom att bara eyeballa diagrammet i Figur 5.9. du kan säga att trenden på antalet dagliga arresteringar är uppe. You8217ll måste planera att expandera antalet trafik officerare, och hoppas att trenden nivåer av snart. Vidare utgår uppgifterna från att fler arresteringar sker rutinmässigt på fredagar och lördagar, så din resursfördelning behöver hantera dessa spikar. Men du måste kvantifiera den underliggande trenden för att bestämma hur många extra polis du måste ha på dig. Du måste också kvantifiera den förväntade storleken på weekendspikesna, för att bestämma hur många extra polis du behöver titta på för ojämna drivrutiner på dessa dagar. Problemet är att från och med nu vet du inte hur mycket av den dagliga ökningen beror på trend och hur mycket beror på den helgenseffekten. Du kan börja genom att avbryta tidsserierna. Tidigare i detta kapitel, i 8220Simple Seasonal Averages, 8221 såg du ett exempel på hur man avbryter en tidsserie för att isolera säsongseffekterna med hjälp av metoden för enkla medelvärden. I det här avsnittet ser du hur du gör det med hjälp av glidande medelvärden8212. Det är mycket sannolikt att metoden för glidande medel används oftare i prediktiv analys än vad som är enkla medelvärderingsmetoden. Det finns olika orsaker till den ökande populariteten hos glidande medelvärden, bland dem, att den genomsnittliga metoden inte ber dig att kollapsa dina data i processen att kvantifiera en trend. Minns att det tidigare exemplet gjorde det nödvändigt att kollapsa kvartalsmedelvärden till årliga medelvärden, beräkna en årlig trend och sedan fördela en fjärdedel av den årliga trenden över varje kvartal i året. Det steget var nödvändigt för att ta bort trenden från säsongseffekterna. Däremot gör det med hjälp av medelvärdet att du kan tömma tidsserierna utan att tillgripa den typen av maskinering. Figur 5.10 visar hur rörelsegradsmetoden fungerar i det nuvarande exemplet. Figur 5.10 Det rörliga genomsnittet i det andra diagrammet klargör den underliggande trenden. Figur 5.10 lägger till en glidande medelkolumn och en kolumn för specifika säsonger. till datasatsen i figur 5.9. Båda tillägg kräver en del diskussioner. Spikarna i arresteringar som äger rum på helgerna ger dig anledning att tro att du arbetar med årstider som upprepas en gång i veckan. Börja därför med att få medeltalet för den omfattade perioden8212, det är de första sju årstiderna, måndag till söndag. Formeln för genomsnittet i cell D5, det första tillgängliga glidande medlet, är följande: Den här formeln kopieras och klistras in genom cell D29, så du har 25 glidande medelvärden baserat på 25 körningar på sju dagar i följd. Observera att för att visa både de första och de sista observationerna i tidsserierna, har jag dolda rader 10 till 17. Du kan förklara dem, om du vill, i denna chapter8217s arbetsbok, tillgänglig från publisher8217s hemsida. Gör ett flertal urval av synliga rader 9 och 18, högerklicka på en av sina radhuvud och välj Unhide från genvägsmenyn. När du döljer ett arbetsblad8217s rader, som I8217ve gjort i Figur 5.10. Alla kartade data i de dolda raderna är också dolda på diagrammet. X-axeln-etiketterna identifierar endast de datapunkter som visas på diagrammet. Eftersom varje glidande medelvärde i figur 5.10 omfattar sju dagar, är inget glidande medelparat ihop med de tre första eller sista tre faktiska observationerna. Kopiering och klistra in formeln i cell D5 upp en dag till cell D4 leder dig ur observationer8212. Det finns ingen observation registrerad i cell C1. På liknande sätt finns inget rörligt medel registrerat under cellen D29. Kopiering och klistra in formeln i D29 till D30 skulle kräva en observation i cell C33, och ingen observation är tillgänglig för den dag som cellen skulle representera. Det skulle naturligtvis vara möjligt att förkorta längden på glidande medelvärdet till fem, i stället för sju. Det innebär att de rörliga medelformlerna i Figur 5.10 kan börja i cell D4 istället för D5. Men i denna typ av analys vill du längden på det rörliga genomsnittet vara lika med antalet årstider: sju dagar i veckan för händelser som återkommer varje vecka innebär ett glidande medelvärde av längden sju och fyra fjärdedelar om året för händelser som återkommer årligen innebär ett glidande medelvärde av längd fyra. På samma sätt kvantifierar vi i allmänhet säsongseffekter på ett sådant sätt att de uppgår till noll inom den överenskomna tidsperioden. Som du såg i detta kapitel8217s första avsnitt, om enkla medelvärden görs detta genom att beräkna genomsnittet av (säg) de fyra kvartalen på ett år och sedan subtrahera årets genomsnitt från varje kvartalsfigur. Det gör så att totala säsongseffekterna är noll. I sin tur är that8217s användbara eftersom det sätter säsongsbetonade effekter på en vanlig footing8212a sommar effekt av 11 är så långt från medelvärdet som en vintereffekt av 821111. Om du vill ha genomsnittliga fem årstider i stället för sju för att få ditt glidande medelvärde, you8217re better av att hitta ett fenomen som upprepas vart femte årstider istället för varje sju. Men när du tar medeltiden av säsongseffekterna senare i processen, är dessa medelvärden osannolikt att summera till noll. It8217s behövs vid den tidpunkten för att kalibrera eller normalisera. medelvärdena så att deras summa är noll. När det är klart att de genomsnittliga säsongsgenomsnitten uttrycker effekten under en tidsperiod som hör till en viss årstid. När det har normaliserats kallas säsongsvärdena de säsongsindex som detta kapitel redan har nämnt flera gånger. You8217ll se hur det fungerar senare i detta kapitel, i 8220Detändra serien med rörliga medelvärden.8221 Förstå specifika säsongsår Figur 5.10 visar också vad som kallas specifika säsonger i kolumn E. De är vilka8217s kvar efter att ha dragit det rörliga genomsnittet från den faktiska observationen. För att få en känsla av vad de specifika säsongerna representerar, överväg det glidande medlet i cell D5. Det är genomsnittet av observationerna i C2: C8. Avvikelserna för varje observation från det rörliga genomsnittet (till exempel C2 8211 D5) garanteras att summa till noll8212that8217s en egenskap av ett medelvärde. Därför uttrycker varje avvikelse effekten av att vara associerad med den speciella dagen under den aktuella veckan. It8217s är en specifik säsong, då8212specifika eftersom avvikelsen gäller för den aktuella måndagen eller tisdag och så vidare och säsongsbetonat eftersom i detta exempel behandlar vi varje dag som om det var en säsong under den närmaste perioden på en vecka. Eftersom varje enskild säsongsåtgärd effekten av att vara under den säsongen vis-224-vis det glidande medelvärdet för den här gruppen av (här) sju årstider, kan du sedan medge de specifika årstiderna för en viss årstid (till exempel alla fredagar i din tidsserier) för att uppskatta den season8217s generella, snarare än specifika, effekt. Det genomsnittet är inte förvirrat av en underliggande trend i tidsserierna, eftersom varje specifikt säsong uttrycker en avvikelse från sitt eget rörliga medelvärde. Att jämföra de rörliga genomsnittsvärdena där8217s är också frågan om att anpassa de glidande medelvärdena med den ursprungliga datamängden. I figur 5.10. Jag har anpassat varje glidande medelvärde med mitten av det antal observationer som den innehåller. Så, till exempel, formeln i cell D5 medeltal observationerna i C2: C8, och jag har anpassat den med den fjärde observationen, mittpunkten för det genomsnittliga intervallet, genom att placera det i rad 5. Detta arrangemang kallas ett centrerat glidande medelvärde . och många analytiker föredrar att justera varje glidande medelvärde med mittpunkten för de observationer som den medeltar. Tänk på att i detta sammanhang refererar 8220midpoint8221 till mitten av en tidsperiod: torsdag är mittpunkten måndag till söndag. Det hänvisar inte till medianen av de observerade värdena, men det kan naturligtvis fungera på det sättet i praktiken. Ett annat tillvägagångssätt är det efterföljande rörliga genomsnittet. I det fallet justeras varje glidande medelvärde med den slutliga observationen att den är genomsnittlig8212 och därför springer den bakom dess argument. Detta är ofta det föredragna arrangemanget om du vill använda ett rörligt medelvärde som en prognos, som görs med exponentiell utjämning, eftersom ditt slutliga rörliga medel inträffar i samband med den slutliga tillgängliga observationen. Centrerade rörliga medelvärden med jämn antal årstider Vi brukar anta ett speciellt förfarande när antalet årstider är jämnt snarare än udda. That8217s typiska tillstånd: Det finns ett jämnt antal årstider under den överenskomna perioden för typiska årstider som månader, kvartaler och fjärdedelar (för val). Svårigheten med jämnt antal årstider är att det inte finns någon mittpunkt. Två är inte mittpunkten för ett område som börjar vid 1 och slutar vid 4, och det är inte heller 3 om man kan säga att man har en, dess mittpunkt är 2,5. Sex är inte mittpunkten 1 till 12, och inte heller 7 är dess rent teoretiska mittpunkt är 6,5. För att fungera som om en mittpunkt existerar, måste du lägga till ett lager av medelvärde ovanpå de glidande medelvärdena. Se figur 5.11. Figur 5.11 Excel erbjuder flera sätt att beräkna ett centrerat glidande medelvärde. Tanken bakom detta tillvägagångssätt för att få ett glidande medelvärde som8217s centreras på en befintlig mittpunkt, när det är ett jämnt antal årstider, är att dra denna mittpunkt framåt med en halv säsong. Du beräknar ett glidande medelvärde som skulle vara centrerat till, till exempel, den tredje punkten om fem säsonger istället för fyra utgjorde en fullständig kalenderändning. That8217s görs genom att ta två på varandra följande glidande medelvärden och medelvärda dem. Så i Figur 5.11. there8217s ett glidande medelvärde i cell E6 som medeltalvärdena i D3: D9. Eftersom det finns fyra säsongsvärden i D3: D9, anses det rörliga genomsnittet i E6 vara centrerat vid den imaginära säsongen 2,5, en halv punkt kort före den första tillgängliga kandidatperioden 3. (Årstiderna 1 och 2 är inte tillgängliga som mittpunkter för brist på data i genomsnitt före säsong 1.) Observera att det rörliga genomsnittet i cell E8 medeltalvärdena i D5: D11, den andra genom den femte i tidsserierna. Det genomsnittet är centrerat på (imaginärt) punkt 3.5, en hel period före genomsnittet centrerad vid 2,5. Genom att medelvärda de två glidande medelvärdena, så tänkandet går, kan du dra mittpunkten för det första glidande medlet framåt med en halv punkt, från 2,5 till 3. That8217s vad medelvärdena i kolumn F i Figur 5.11 gör. Cell F7 ger medelvärdet av de glidande medelvärdena i E6 och E8. Och medelvärdet i F7 är i linje med den tredje datapunkten i de ursprungliga tidsserierna, i cell D7, för att betona att medlet är centrerat på den säsongen. Om du expanderar formeln i cell F7 samt de glidande medelvärdena i cellerna E6 och E8 ser du8217ll att det visar sig vara ett viktat medelvärde av de första fem värdena i tidsserierna, varvid det första och femte värdet ges en vikt av 1 och den andra genom fjärde värden som ges en vikt av 2. Det leder oss till ett snabbare och enklare sätt att beräkna ett centrerat glidande medelvärde med ett jämnt antal årstider. Fortfarande i Figur 5.11. vikterna lagras i intervallet H3: H11. Denna formel returnerar det första centrerade glidande medlet, i cell I7: Den här formeln returnerar 13.75. vilket är identiskt med värdet beräknat med den dubbelgenomsnittliga formeln i cell F7. Hänvisning till vikterna absolut, med dollartecken i H3: H11. Du kan kopiera formeln och klistra in den så långt som behövs för att få resten av de centrerade glidande medelvärdena. Avskaffande av serien med rörliga genomsnittsvärden När du har dragit bort de rörliga medelvärdena från de ursprungliga observationerna för att få de specifika årstiderna, har du tagit bort den underliggande trenden från serien. Vad8217s kvar i de specifika säsongerna är normalt en stillastående, horisontell serie med två effekter som gör att de specifika säsongerna avviker från en absolut rak linje: de säsongseffekter och slumpmässiga fel i de ursprungliga observationerna. Figur 5.12 visar resultaten för detta exempel. Figur 5.12 De specifika säsongseffekterna för fredag och lördag är tydliga i den avgränsade serien. Det övre diagrammet i Figur 5.12 visar de ursprungliga dagliga observationerna. Både den allmänna uppåtgående trenden och helgens säsongspinnar är tydliga. Nedre diagrammet visar de specifika säsongerna: resultatet av att det ursprungliga serien avbryts med ett rörligt genomsnittligt filter som beskrivits tidigare i 8220Understående specifika säsongserier.8221 Du kan se att den avgränsade serien nu är nästan horisontell (en linjär trendlinje för de specifika säsongerna har en liten nedåtgående drift), men säsongens fredag och lördagspinnar är fortfarande på plats. Nästa steg är att flytta bortom säsongerna till säsongsindex. Se figur 5.13. Figur 5.13 De specifika säsongseffekterna förstvärderas och normaliseras sedan för att nå säsongsindex. I Figur 5.13. De specifika säsongerna i kolumn E omordnas i tabellformen som visas i intervallet H4: N7. Syftet är helt enkelt att göra det enklare att beräkna säsongsmedelvärdena. Dessa medelvärden visas i H11: N11. Men siffrorna i H11: N11 är medelvärden, inte avvikelser från ett genomsnitt, och därför kan vi inte förvänta dem att summa till noll. Vi behöver fortfarande justera dem så att de uttrycker avvikelser från ett stort medelvärde. Det stora medelvärdet framträder i cell N13, och är medelvärdet av säsongsmedelvärdena. Vi kan komma fram till säsongsindex genom att subtrahera den stora medelvärdet i N13 från varje säsongsmedel. Resultatet ligger i intervallet H17: N17. Dessa säsongsindex är inte längre specifika för ett visst rörligt medelvärde, vilket är fallet med de specifika säsongerna i kolumn E. Eftersom de8217re baseras på ett genomsnitt av varje förekomst av en given årstid, uttrycker de den genomsnittliga effekten av en given säsong över fyra veckor i tidsserierna. Dessutom är de åtgärder för en säsong8217s8212 där, en dag8217s8212effekt på trafikarrestationer vis-224-vis genomsnittet för en sju dagarsperiod. Vi kan nu använda säsongsindex för att deseasonalisera serien. We8217ll använder deseasonalized-serien för att få prognoser genom linjär regression eller Holt8217s metod för utjämning av trender-serien (diskuterad i kapitel 4). Sedan lägger vi helt enkelt säsongsindex tillbaka till prognoserna för att återställa dem. Allt detta framgår av Figur 5.14. Figur 5.14 Efter att du har säsongsindex, är de finjusteringar som tillämpas här detsamma som i metoden för enkla medelvärden. Stegen som illustreras i Figur 5.14 är i stort sett desamma som i Figur 5.6 och 5.7. diskuteras i följande avsnitt. Deseasonalizing the Observations Drasa säsongsindex från de ursprungliga observationerna för att deseasonalize data. Du kan göra det som visas i Figur 5.14. där de ursprungliga observationerna och säsongsindexen är ordnade som två listor som börjar i samma rad, kolumnerna C och F. Detta arrangemang gör det lite enklare att strukturera beräkningarna. Du kan också göra subtraktionen som visas i Figur 5.6. där de kvartalsvisa kvartalsobservationerna (C12: F16), de kvartalsvisa indexerna (C8: F8) och de desasonerade resultaten (C20: F24) visas i tabellformat. Det arrangemanget gör det lite lättare att fokusera på säsongsindex och de kvartalet kvartalsvisa. Prognos från Deseasonalized Observations I Figur 5.14. deseasonalized observationer finns i kolumn H, och i Figur 5.7 de8217re i kolumn C. Oavsett om du vill använda en regressionsmetod eller en utjämning till prognosen, är it8217s bäst att ordna deseasonaliserade observationer i en enda kolumnlista. I figur 5.14. prognoserna finns i kolumn J. Följande matrisformel anges i intervallet J2: J32. Tidigare i detta kapitel påpekade jag att om du släpper bort x-värdesargumentet från TREND () - funktionen8217s argument, levererar Excel standardvärdena 1. 2. n. där n är antalet y-värden. I den angivna formeln innehåller H2: H32 31 y-värden. Eftersom argumentet som normalt innehåller x-värdena saknas, levererar Excel standardvärdena 1. 2. 31. Det är de värden vi skulle vilja använda ändå i kolumn B, så formeln som given motsvarar TREND (H2: H32, B2: B32). Och that8217s strukturen som används i D5: D24 i Figur 5.7: Gör ett steg framåtprognos Så långt har du arrangerat prognoser för deseasonaliserade tidsserier från t 1 till t 31 i figur 5.14. och från t 1 till t 20 i figur 5.7. Dessa prognoser utgör användbar information för olika ändamål, inklusive bedömning av prognosernas noggrannhet med hjälp av en RMSE-analys. Men ditt huvudsakliga syfte är att prognosera åtminstone den nästa, ännu obemannade tidsperioden. För att få det kan du först prognosa från funktionen TREND () eller LINEST () om you8217re använder regression eller från exponentiell utjämningsformel om you8217re använder Holt8217s metod. Då kan du lägga till det associerade säsongsindexet till regressions - eller utjämningsprognosen, för att få en prognos som innehåller både trend och säsongseffekt. I figur 5.14. du får regressionsprognosen i cell J33 med denna formel: I denna formel är y-värdena i H2: H32 densamma som i de andra TREND () - formlerna i kolumn J. Så är (default) x-värdena på 1 genom 32. Nu levererar du dock ett nytt x-värde som funktion8217s tredje argument, vilket du säger TREND () att leta efter i cell B33. It8217s 32. nästa värde av t. Och Excel returnerar värdet 156.3 i cell J33. Funktionen TREND () i cell J33 berättar Excel, i verkligheten 8220 Beräkna regressionsekvationen för värdena i H2: H32 regresseras på t-värdena 1 till 31. Applicera den här regressionsekvationen till det nya x-värdet på 32 och returnera resultatet.8221 You8217ll hitta samma tillvägagångssätt som tagits i cell D25 i figur 5.7. där formeln för att få ett steg framåt prognosen är detta: Lägga till säsongsindex igen. I det sista steget är att omvärdera prognoserna genom att lägga till säsongsindex till trendprognoserna och vända tillbaka vad du gjorde fyra steg tillbaka när du subtraherade index från de ursprungliga observationerna. Detta görs i kolumn F i Figur 5.7 och kolumn K i Figur 5.14. Don8217t glömmer att lägga till det lämpliga säsongsindexet för prognosen med ett steg framåt, med resultaten som visas i cell F25 i Figur 5.7 och i cell K33 i Figur 5.14. (I8217ve skuggade de enstegsfria cellerna i både Figur 5.7 och Figur 5.14 för att markera prognoserna.) Du kan hitta diagram över tre representationer av trafikhäktningsdata i Figur 5.15. den decesasonalized serien, den linjära prognosen från deseasonalized data, och de reseasonalized prognoserna. Observera att prognoserna innehåller både den allmänna trenden för de ursprungliga uppgifterna och dess FridaySaturday spikes. Figur 5.15 Diagram över prognoserna.
No comments:
Post a Comment