Monday 5 March 2018

차이점 이동 평균 및 자동 회귀 모델


ARIMA p, d, q 예측 방정식 ARIMA 모형은 이론적으로 시계열을 예측하기위한 가장 일반적인 종류의 모델이며 필요에 따라 차분에 의해 고정 될 수 있습니다. 아마도 비선형 변환과 함께 사용됩니다 필요한 경우 로깅 또는 수축 등의 통계적 특성이 시계열 인 임의의 변수는 통계적 특성이 모두 일정한 경우 고정적입니다. 고정 된 시리즈는 추세가 없으며 평균 주위의 변이가 일정한 진폭을 가지며 일정한 방식으로 흔들립니다 즉, 그것의 단기간 무작위 시간 패턴은 항상 통계적 의미에서 동일하게 보입니다. 후자의 조건은 평균으로부터의 이전의 자체 편차와의 자기 상관 상관 관계가 시간에 따라 일정하거나 동등하게 시간에 따라 일정하다는 것을 의미합니다. 이 형식의 변수는 신호와 노이즈의 조합으로 평소와 같이 볼 수 있으며, 신호가 분명하다면 그 신호는 patt 일 수 있습니다 고속 또는 느린 평균 반향 또는 정현파 진동 또는 부호의 급격한 변화가있을 수 있으며 계절 성분을 가질 수도 있습니다. ARIMA 모델은 신호를 잡음에서 분리하려고하는 필터로 볼 수 있으며 신호는 고정 된 시계열에 대한 ARIMA 예측 방정식은 예측 변수가 종속 변수의 시차와 예측 오차의 시차로 구성되는 선형 즉 회귀 식 방정식입니다. 예측 된 Y 값 Y의 최근 값 중 하나 이상의 가중치 합계 또는 가중치 합계 또는 하나 이상의 최신 오류 값의 가중치 합계가 포함됩니다. 예측 변수가 Y의 지연 값으로만 ​​구성되면 순수 자동 회귀 자기 회귀 모델이며, 이것은 회귀 모델의 특별한 경우이며 표준 회귀 소프트웨어가 적용될 수 있습니다. 예를 들어, Y에 대한 1 차 자동 회귀 AR 1 모델은 독립 변수 i Statistical에서 1 LAG Y, RegressIt에서 YLAG1 예측 자 중 일부가 오류의 래그 인 경우 ARIMA 모델은 선형 회귀 모델이 아닙니다. 마지막 기간을 지정하는 방법이 없기 때문입니다 독립 변수로서 모델이 데이터에 적합 할 때 기간별로 오류를 계산해야합니다 기술적 관점에서 지연 변수를 예측 변수로 사용하는 문제는 모델의 예측이 모델의 선형 함수가 아니라는 것입니다. 비록 과거의 데이터의 선형 함수이기는하지만 계수이기 때문에 오차가 포함 된 ARIMA 모델의 계수는 방정식 시스템을 풀기보다는 비선형 최적화 방법 인 힐 클라이밍으로 추정해야합니다. 약어 ARIMA는 Auto-Regressive Integrated 예측 평균 방정식에서 이동 평균 (stationary average)의 진폭은 자기 회귀 항 (autoregressive terms)이라고 불리며, 예측 오차의 시차는 이동 평균 항 (moving average terms)이라고 불린다. 고정 된 시리즈의 통합 버전이라고합니다. 무작위 산책 및 임의 추세 모델, 자동 회귀 모델 및 지수 평활 모델은 모두 ARIMA 모델의 특수 사례입니다. 비 계절 ARIMA 모델은 ARIMA p, d, q 모델, 여기서, p는 자동 회귀 항의 수이고, d는 확정에 필요한 비 계절적 차이의 수이고, q는 예측 방정식의 지연 예측 오류 수입니다. 예측 방정식은 다음과 같이 구성됩니다 첫째, Y가 의미하는 d 번째 차이를 나타내는 것으로하자. Y의 두 번째 차이 d 2 경우는 2 시간 이전과의 차이가 아니라는 점을 유의하라. 오히려 첫 번째 차이점은 첫 번째 차이점이다. 2 차 미분의 이산 아날로그, 즉 지역 경향보다는 직렬의 국부 가속도. y의 관점에서 일반적인 예측 방정식은 다음과 같습니다. 여기에서 이동 평균 매개 변수 s는 eq에서 부호가 음수가되도록 정의됩니다 Box and Jenkins가 소개 한 국제 협약에 의거하여 R 프로그래밍 언어를 포함한 일부 저작자와 소프트웨어는 대신에 더하기 기호를 갖도록 정의합니다. 실제 숫자가 방정식에 연결될 때 모호성은 없지만 어떤 규약 출력을 읽을 때 소프트웨어가 사용합니다. 매개 변수가 AR 1, AR 2, MA 1, MA 2 등으로 표시되는 경우가 종종 있습니다. Y에 대한 적절한 ARIMA 모델을 식별하려면 차이점 처리의 순서를 결정해야합니다. 시리즈를 스테라 타 레이즈하고 계절성의 총체적인 특징을 제거 할 것입니다. 아마도 로깅이나 수축과 같은 분산 안정화 변환과 관련되어있을 것입니다. 이 시점에서 멈추고 차이가있는 시리즈가 일정하다고 예측하면 무작위 걸음 걸이 또는 임의대로 걸기 만하면됩니다 트렌드 모델 그러나, stationarized 시리즈는 자기 상관 (autocorrelated) 오차를 여전히 가질 수 있으며, AR 항 p1 및 / 또는 MA 항 q1의 일부가 또한 필요하다는 것을 제안한다 주어진 시계열에 가장 적합한 p, d 및 q의 값을 결정하는 과정은이 페이지의 맨 위에 링크가있는 노트의 이후 섹션에서 논의되지만 일부 페이지의 미리보기 일반적으로 직면하는 비 계절 ARIMA 모델 유형의 예가 아래에 주어져 있습니다. ARIMA 1,0,0 1 차 자동 회귀 모델은 시리즈가 고정되어 있고 자동 상관되는 경우, 아마도 자체의 이전 값의 배수와 상수이 경우의 예측 방정식은이다. Y는 그 자체가 한주기만큼 뒤떨어져있다. 이것은 ARIMA 1,0,0 상수 모델이다. Y의 평균이 0이면 상수 항은 포함되지 않을 것이다. 계수 1이 양수이고 크기가 1보다 작 으면 Y가 고정되어 있으면 크기가 1보다 작아야하며 모델은 다음주기 값이 다음과 같이 평균에서 1 배가 될 것으로 예측되어야하는 평균 복귀 거동을 설명합니다. 이 기간 값 1이 음수이면 즉, 평균이 기간보다 길다면 의미가 다음 기간보다 짧을 것이라고 예측한다. 2 차 자동 회귀 모델 ARIMA 2,0,0에서, 오른쪽의 Y t-2 항 등 계수의 부호와 크기에 따라 ARIMA 2,0,0 모델은 평균 복귀가 사인파 진동 방식으로 발생하는 시스템을 설명 할 수 있습니다. 무작위 걸음 Y 시리즈가 고정되어 있지 않으면 가장 간단한 모델은 무작위 걸음 걸이 모델로, 자기 회귀 계수가 1 인 AR 1 모델, 즉 무한히 느린 평균 반향을 갖는 계열이 모델의 예측 방정식은 다음과 같이 쓸 수 있습니다. 상수 항은 평균 기간 변동, 즉 장기 드리프트 Y 로이 모델은 노 - 요격 다시 장착 될 수 첫 번째 Y 차를 종속 변수로하는 Gression 모델 비수 식적 차이와 상수 항만을 포함하기 때문에 상수가있는 ARIMA 0,1,0 모델로 분류됩니다. 무작위 walk-without-drift 모델은 ARIMA 0,1,0 모델은 상수가 없습니다. ARIMA 1,1,0 차이가있는 1 차 자동 회귀 모델 임의의 보행 모델의 오차가 자동 상관되면, 아마도 문제는 종속 변수의 한 지연을 예측 방정식 - 즉, Y의 첫 번째 차이를 1주기만큼 후퇴시킴으로써 다음과 같은 예측 방정식을 산출 할 수 있습니다. 이것은 재 배열 될 수 있습니다. 이것은 비 계절별 차이와 상수 항이있는 1 차 자동 회귀 모델입니다 - ARIMA 1,1,0 모델. ARIMA 0,1,1, 일정한 지수 평활화가없는 경우. 무작위 걸음 모델에서 자동 상관 오류를 수정하기위한 또 다른 전략은 간단한 지수 평활화 모델에 의해 제안됩니다. 비정규 시계열 예 : 천천히 변하는 평균 주위의 시끄러운 요동을 나타내는 시계열 무작위 도보 모델은 과거 값의 이동 평균뿐만 아니라 다음 관찰의 예측으로 가장 최근의 관측치를 사용하지 않고 , 노이즈를 필터링하고 지역 평균을보다 정확하게 추정하기 위해 마지막 몇 가지 관측치의 평균을 사용하는 것이 더 좋습니다. 이 지수를 달성하기 위해 지수 가중 이동 평균을 사용한 지수 평활화 모델이 과거 값의 이동 평균을 사용합니다. 간단한 지수 평활화 모델은 수학적으로 동일한 형태로 작성 될 수 있는데, 그 중 하나는 이전의 예측이 오류의 방향으로 조정되는 소위 오류 수정 형식입니다. 1 - t - 1 정의에 따르면, 이것은 ARIMA 0,1,1과 같이 다시 쓸 수 있습니다. - 1 - 1로 일정하지 않은 예측 방정식 - 이것은 당신이 간단한 지수 smo ARIMA 0,1,1 모델을 상수가 아닌 것으로 지정하여 추정 한 MA 1 계수는 SES 공식에서 1 - 마이너스 - 알파에 해당합니다. SES 모델에서 1- 기간 예측은 1 일입니다. 이는 추세 또는 전환점을 약 1 기간 지연시키는 경향이 있습니다. ARIMA의 1 기간 예측에서 평균 데이터가 0,1,1 - 상수 모델은 1 1 - 1입니다. 예를 들어, 1 0 8 일 경우 평균 연령은 5입니다. 1이 1에 가까워지면 ARIMA 0,1,1 - 비 상수 모델은 매우 장기적인 이동 평균이됩니다. 1이 0에 가까워 질수록 랜덤 워크리스 드리프트 모델이됩니다. AR 항을 추가하거나 MA 항을 추가하는 자기 상관을 보정하는 가장 좋은 방법 위에 언급 한 이전 두 모델에서 임의 워킹 모델의 자기 상관 오류의 문제 방정식에 차분 계열의 지연 값을 추가하거나 foreca의 지연 값을 추가하여 두 가지 다른 방법으로 수정되었습니다. st error 어느 접근법이 가장 좋은가이 상황에 대한 경험칙은 나중에 자세하게 논의 될 것이며, 양의 자기 상관은 일반적으로 AR 항을 모델에 추가하여 가장 잘 처리되며 음의 자기 상관은 일반적으로 MA 용어 추가 비즈니스 및 경제 시계열에서 부정적 자기 상관은 종종 차이점 생성의 인공물로 발생합니다. 일반적으로 차이 분석은 양의 자기 상관 관계를 감소 시키며 긍정에서 부정적인 자기 상관로 전환 할 수도 있습니다. 따라서 ARIMA 0,1,1 모델은 ARIMA 1,1,0 모델보다 차별화 된 MA 용어가 더 자주 사용됩니다. ARIMA 0,1,1 성장과 함께 일정하고 단순한 지수 평활화 ARIMA 모델로 SES 모델을 구현하면 실제로 유연성 우선, 추정 된 MA 1 계수는 음수가 허용된다. 이는 SES 모델에서 1보다 큰 평활화 계수에 해당하며, 일반적으로 SES 모델 피팅 절차에 의해 허용되지 않는다. ARIMA 모델에 일정한 항을 포함 시켜서 평균 0이 아닌 추세를 추정 할 수 있습니다. 상수가있는 ARIMA 0,1,1 모델은 예측 방정식을가집니다. 한주기 미리 이 모델의 예측은 장기 예측의 궤도가 일반적으로 기울기가 수평 선이 아닌 mu와 동일한 경 사진 선인 경우를 제외하고는 SES 모델의 예측과 정 성적으로 유사합니다. ARIMA 0,2,1 또는 0, 선형 선형 지수 평활화가없는 선형 선형 평활화 모델은 MA 조건과 함께 2 개의 비 계절적 차이를 사용하는 ARIMA 모델입니다. 계열 Y의 두 번째 차이는 단순히 Y와 두 기간에 의해 지연되는 자체의 차이가 아니라 오히려 첫 번째 차이의 첫 번째 차이 - 기간 t에서의 Y의 변화 변화 따라서, 기간 t에서의 두 번째 Y 차이는 다음과 같습니다. Y t - Y t - 1 - Y t - 1 - Y 이산 함수의 두 번째 차이점은 analogue이다. s를 연속 함수의 2 차 미분 값으로 변환합니다. 상수가없는 ARIMA 0,2,2 모델은 계열의 두 번째 차이가 마지막 함수의 선형 함수와 같다고 예측합니다 두 개의 예측 오차. 재 배열 될 수있다. 1과 2는 MA 1과 MA 2 계수이다. 이것은 홀트 모델과 본질적으로 동일한 일반적인 선형 지수 평활 모델이며 브라운 모델은 특별한 경우이다. 지수 적으로 가중 된 이동 평균을 사용하여 일련의 지역 수준과 지역 추세를 추정합니다. 이 모델의 장기 예측은 계열의 끝으로 관측 된 평균 추세에 따라 기울기가 정해지는 직선으로 수렴됩니다. ARIMA 1,1,2 일정한 감쇠 추세 선형 지수 평활화. 이 모델은 ARIMA 모델의 동반 슬라이드에 설명되어 있습니다. 시리즈 끝 부분에서 지역 경향을 추정 하지만 더 긴 예측 시야에서이를 평평하게하여 경험적 지원이있는 실무 Gardner와 McKenzie의 감쇠 된 추세에 대한 기사와 Armstrong 외의 Golden Rule 기사를 참조하십시오. 일반적으로 p q는 1보다 크지 않습니다. 즉, ARIMA 2,1,2와 같은 모델을 적합하게하려고하지 마십시오. 이는 overfitting 및 공통 요인 문제로 이어질 가능성이 있으므로 수학에 관한 참고 사항에서 자세히 설명합니다 ARIMA 모델의 구조. 스프레드 시트 구현 위에서 설명한 ARIMA 모델은 스프레드 시트에서 구현하기 쉽습니다. 예측 식은 원래 시간 시리즈의 과거 값과 오류의 과거 값을 참조하는 단순한 선형 방정식입니다. 따라서, A 열의 데이터, B 열의 예측 수식 및 C 열의 오류 데이터를 뺀 ARIMA 예측 스프레드 시트 열 B의 일반적인 셀의 예측 수식은 단순히 선형 표현식 n 열 A와 C의 이전 행의 값을 참조하고 스프레드 시트의 다른 곳에 셀에 저장된 적절한 AR 또는 MA 계수를 곱한 값 ARIMA 모델의 AR 또는 MA 항 수를 식별합니다. ACF 및 PACF 플롯 시간 시리즈 차분에 의해 스테레오 라이즈 된 경우, ARIMA 모델을 적용하기위한 다음 단계는 차분 된 시리즈에 남아있는 자기 상관을 수정하기 위해 AR 또는 MA 항이 필요한지 여부를 결정하는 것입니다. 물론 Statgraphics와 같은 소프트웨어를 사용하면 용어를 선택하고 가장 효과가 좋은 것이 있는지 확인하십시오. 그러나 더 체계적인 방법이 있습니다. 차분 함수 ACF와 차분 계열의 부분 자기 상관 PACF 도표를 보면 필요한 AR 및 MA 항의 수를 잠정적으로 식별 할 수 있습니다. 이미 ACF 플롯에 익숙한 것은 시계열과 자체의 시차 간의 상관 계수의 막 대형 차트 일뿐입니다. PACF 플롯은 부분 일반적으로 두 변수 간의 부분 상관 관계는 특정 변수 집합과의 상호 상관에 의해 설명되지 않는 두 변수 간의 상관 관계입니다. 예를 들어 변수를 회귀 분석하면 Y와 다른 변수 X1, X2 및 X3에서 Y와 X3 간의 부분 상관 관계는 X1과 X2와의 공통 상관 관계로 설명되지 않는 Y와 X3 간의 상관 관계입니다. 이 부분 상관 관계는 다음과 같이 계산할 수 있습니다. X1과 X2에서 Y의 회귀에 X3을 더함으로써 분산의 감소를 나타냅니다. 부분 자동 상관은 모든 하위 차수의 상관 관계로 설명되지 않는 변수와 자체 지연의 상관 관계입니다 지연 1에서 시계열 Y의 자기 상관은 Yt와 Yt-1 사이의 상관 계수로 아마도 Yt-1과 Yt-2 사이의 상관 관계 일 것이다. 그러나 Yt가 상관 관계가 있다면 d가 Y t -1이고 Y t -1이 Y t -2와 똑같이 상관된다면 Y t와 Y t-2 사이의 상관 관계를 발견해야한다. 사실상 지연 2에서 기대해야하는 상관 관계의 양은 정확하게 lag-1 상관의 제곱 따라서, 지연 1에서의 상관 관계는 지연 2로 그리고 아마 고차 지연으로 전파한다. 따라서 지연 2에서의 부분 자기 상관은 지연 2에서의 실제 상관과 자기 상관은 많은 수의 지연에 대해 유의미합니다. 그러나 2 이상에서의 자기 상관은 단순히 자기장에 의한 것일 수 있습니다. PACF 플롯에 의해 확인됩니다. PACF 플롯은 지연 1에서만 중요한 스파이크를 갖습니다. 즉, 모든 고차 자기 상관이 지연 -1 자기 상관에 의해 효과적으로 설명됩니다. 파 모든 래그에서의 자기 상관은 일련의 지연을 갖는 자기 회귀 모델의 피팅에 의해 계산 될 수있다. 특히, 지연 k에서의 부분 자기 상관은 k 항을 갖는 자기 회귀 모델에서의 추정 된 AR k 계수와 동일하다 - 즉, 다중 회귀 모델 Y는 LAG Y, 1, LAG Y, 2 등의 LAG Y, k까지 회귀합니다. 따라서 PACF의 단순한 검사를 통해 한 번에 자기 상관 패턴을 설명하는 데 필요한 AR 항의 수를 결정할 수 있습니다 계열의 자기 상관이 지연 k에서 중요하고 더 높은 차수 래그에서 유의하지 않은 경우 (즉, PACF가 지연 k에서 절단되는 경우), 이는 주문 k의 자동 회귀 모델을 피팅 해보아야 함을 의미합니다. UNITS 시리즈는 지연 1에서 매우 큰 스파이크를 가지며 다른 중요한 스파이크가없는 컷오프 현상의 극한 예를 제공합니다. 이는 차분이없는 경우 AR 1 모델을 사용해야 함을 나타냅니다. 그러나이 모델의 AR 1 항 ~ 할거야. 1 차에서의 PACF 스파이크의 높이 인 추정 된 AR 1 계수가 1과 거의 동일하기 때문에 첫 번째 차이와 동등한 것으로 가정합니다. 이제 일련의 Y에 대한 AR 1 모델의 예측 방정식이 이 방정식의 AR 1 계수 1이 1이면, Y의 첫 번째 차이가 일정하다는 것을 예측하는 것과 같습니다. 즉, 무작위 도보 모델의 성장 방정식과 같습니다. UNITS 시리즈의 PACF는 차이가 없다면 첫 번째 차이점을 취하는 것과 동등한 AR 1 모델에 적합해야한다고 말하고 있습니다. 즉, UNITS가 실제로 필요로하는 것은 AR과 MA 시그니처 ACF가 더 느리게 쇠퇴하는 동안 PACF가 날카로운 컷오프를 표시하는 경우 즉, 더 높은 지체에서 상당한 스파이크가있는 경우, stationarized 시리즈에 AR 서명이 표시된다. 즉, 자기 상관 패턴이 설명 AR 용어를 추가하는 것보다 AR 용어를 더 쉽게 추가 할 수 있습니다. AR 서명은 대개 지연 1에서 양의 자기 상관과 일반적으로 연관되어 있음을 알 수 있습니다. 즉, 약간 차이가있는 연속으로 발생하는 경향이 있습니다. AR 항은 예측 방정식에서 부분적인 차이와 같이 작용할 수 있습니다. 예를 들어, AR 1 모델에서 AR 항은 자기 회귀 계수가 1이면 첫 항의 역할을하고, 자기 회귀 계수가 0이면 아무것도하지 않으며, 계수가 0과 1 사이에있는 경우 부분 차이와 같은 역할을합니다. 즉, 계열이 약간 미분 된 경우 - 즉 양의 자기 상관의 비정규 패턴이 완전히 제거되지 않은 경우 AR 서명을 표시하여 부분 차이를 요청합니다. AR 조건을 추가 할시기를 결정할 때 다음과 같은 경험 룰이 있습니다. 규칙 6 차분 시리즈의 PACF가 날카로운 컷오프를 표시하거나 지연 -1 자기 상관이 양수이면 만약 PACF가 끊어지는 지연은 AR 항의 표시된 수이다. 원칙적으로, 임의의 자기 상관 패턴은 고정 된 계열로부터 충분히 제거함으로써 제거 될 수있다 자기 회귀 항은 예측 방정식에 대해 연속 된 시리즈의 시간보다 뒤떨어져 있으며, PACF는 그러한 용어가 얼마나 많이 필요할지를 알려줍니다. 그러나 이것은 항상 자기 상관의 주어진 패턴을 설명하는 가장 간단한 방법은 아닙니다. 때때로 MA 항을 추가하는 것이 더 효율적입니다 대신에 예측 오차의 시차 ACF는 AR 조건에 대해 PACF가 사용하는 MA 조건에 대해 동일한 역할을 수행합니다. 즉, ACF는 차감 된 값에서 나머지 자기 상관을 제거하는 데 필요한 MA 항의 수를 알려줍니다 계열 자기 상관이 지연 k에서 중요하지만 더 높은 시간 지연에서 중요하지 않은 경우 - 즉, ACF가 지연 k에서 절단되는 경우, 이는 정확히 k MA 항이 예측 방정식 후자의 경우, stationarized 계열은 MA 서명을 표시한다고 가정합니다. 즉, AR 항을 추가하는 것보다 MA 항을 추가하여 자기 상관 패턴을 더 쉽게 설명 할 수 있습니다. MA 서명은 일반적으로 지연 1에서 음의 자기 상관과 관련됩니다 - 그것은 약간 차이가있는 연속적으로 발생하는 경향이 있습니다. 이 이유는 MA 용어가 예측 방정식에서 차분의 차수를 부분적으로 취소 할 수 있다는 것입니다. 이것을 보려면 ARIMA 0,1,1 모델이 상수 단순 지수 평활 모델과 동일합니다. 이 모델의 예측 방정식은 SES 모델에서 MA 1 계수 1이 수량 1에 해당하는 경우입니다. 1이 1과 같으면이 값은 0 인 SES 모델에 해당합니다. 예측이 결코 업데이트되지 않기 때문에 단지 일정한 모델입니다. 이는 1이 1 일 때 실제로 SES 예측이 자체적으로 다시 앵커링 할 수있는 차분 연산을 취소한다는 것을 의미합니다 반면에 이동 평균 계수가 0이면이 모델은 무작위 걸음 모델로 줄어 듭니다. 즉, 차이 작업 만 남겨 둡니다. 따라서 1이 0보다 큰 경우에는 우리가 부분적으로 차분 명령을 취소하는 경우 계열이 이미 약간 차분을 초과 한 경우 - 즉 음의 자기 상관이 도입 된 경우 - MA 서명을 표시하여 차이가 부분적으로 취소되도록 요청합니다. 팔을 많이 흔들며 이 효과에 대한보다 엄격한 설명은 ARIMA 모델의 수학적 구조에 나와 있습니다. 유인물 따라서 다음과 같은 추가 규칙이 있습니다. 규칙 7 차분 시리즈의 ACF가 날카로운 컷오프를 표시하거나 지연 1 자기 상관 관계가 음수 - 시리즈가 약간 지나치게 차이가 나는 경우 - 모델에 MA 항을 추가하는 것을 고려하십시오. ACF가 절단되는 지체는 표시된 MA 항의 수입니다. UNITS 시리즈의 모델 - ARIMA 2,1, 0 Previousl y 우리는 UNITS 시리즈가 적어도 하나의 비 계절별 차이 판별을 필요로 함을 확인했습니다. 하나의 비 계절적 차이를 취한 후에 - 즉, ARIMA 0,1,0 모델을 상수로 맞추기 - ACF와 PACF 도표는 이와 같이 보입니다. a lag 1에서의 상관 관계는 유의하고 양의 값을 가지며, b PACF는 ACF보다 더 가파른 컷오프를 나타낸다. 특히, ACF는 4를 가지지 만, PACF는 단지 두 개의 중요한 스파이크를 갖는다. 따라서, 위의 규칙 7에 따라, AR 2 서명 그러므로 우리가 AR 용어의 순서를 2로 설정하면 (ARIMA 2,1,0 모델에 적합) - 잔차에 대한 다음 ACF 및 PACF 플롯을 얻습니다. 중요한 후진에서의 자기 상관 - 즉 래그 1과 2가 제거되고 고차 지연에 식별 할 수있는 패턴이 없음 잔차의 시계열 플롯은 평균에서 벗어나기가 다소 걱정스러운 경향을 보입니다. 그러나 분석 요약 보고서는 그럼에도 불구하고 모델은 t에서 꽤 잘 수행된다. 검증 기간 동안 AR 계수는 모두 0과 상당히 다르며 AR 항의 추가로 잔차의 표준 편차가 1 54371에서 1 4215로 거의 10 감소했습니다. 또한 단위 루트의 부호가 없습니다. AR 계수의 합 0 252254 0 195572는 1에 가깝지 않습니다. 단위 근원은 아래에서 자세히 논의됩니다. 전체적으로 이것은 좋은 모델 인 것으로 보입니다. 모델에 대한 변형되지 않은 예측은 미래로 예상되는 선형 상승 추세를 보여줍니다. 장기 예측의 추세는 모델에 하나의 비 계절적 차이와 상수 기간이 포함되어 있다는 사실에 기인합니다. 이 모델은 기본적으로 두 개의 자동 회귀 조건을 추가하여 성장이 미세한 무작위 도보입니다. 즉 차분 된 series 장기 예측의 기울기 즉, 한 기간에서 다른 기간으로 평균 증가는 모델 요약의 평균 기간과 같습니다. 0 467566 예측 방정식은입니다. 모델 요약의 상수항은 어디에 있습니까? ary 0 258178, 1은 AR 1 계수 0 25224이고 2는 AR 2 계수 0 195572입니다. 대 상수 일반적으로 ARIMA 모델의 출력에서 ​​평균 항은 차분 된 계열의 평균 즉 평균 경향을 나타냅니다 Differencing의 차수가 1 인 경우, 상수는 예측 방정식의 오른쪽에 나타나는 상수 항이다. 평균 항과 상수 항은 방정식에 의해 관련된다. CONSTANT MEAN 1 - AR 이 경우, 우리는 0 258178 0 467566 1 - 0 25224 - 0 195572입니다. UNITS 시리즈의 대체 모델 - ARIMA 0,2,1 UNITS 시리즈를 분석하기 시작했을 때, 우리는 완전히 확신 할 수 없었던 것을 상기해라. 비 차별적 차분의 한 순서는 가장 낮은 표준 편차와 온화한 긍적 자기 상관 패턴을 나타 냈지만 두 차례의 비 계절별 차이는 더 고정 된 시계열을 보였으 나 오히려 강한 음의 자기 상관 관계를 나타냈다 여기 ACF와 PACF 둘 다 비 계절적 차이가있는 시리즈입니다. ACF에서 지연 1의 단일 음수 스파이크는 위의 규칙 8에 따라 MA 1 서명입니다. 따라서 2 가지 비 계절적 차이를 사용한다면 또한 MA 1 항을 포함하여 ARIMA 0,2,1 모델을 생성하고자한다. 규칙 5에 따르면, 상수 항을 억제하기를 원할 것이다. 여기서 ARIMA 0,2,1 모델을 상수. 추정 된 백색 잡음 표준 편차 RMSE는 이전 모델보다이 모델에 대해서 단지 약간 높다. 1 46301 대 1 45215 이전에이 모델에 대한 예측 방정식은이다. 여기서 쎄타 -1은 MA 1 계수이다. LES 모델의 양 2 1-alpha에 해당하는 MA 1 계수가있는 선형 지수 평활화 모델과 유사합니다. 이 모델의 MA 1 계수는 76이 0 인 72 근처에 알파가있는 LES 모델이 거의 똑같이 잘 맞는다. 사실, L ES 모델이 동일한 데이터에 맞으면 알파의 최적 값은 0 61로 밝혀집니다. 너무 멀리 떨어져 있지 않습니다. ARIMA 2,1,0 모델을 상수와 맞추기 한 결과를 보여주는 모델 비교 보고서가 있습니다 , 상수가없는 ARIMA 0,2,1 모델 및 LES 모델을 포함합니다. 세 가지 모델은 추정 기간 동안 거의 동일하게 수행되며 ARIMA 2,1,0 모델은 상수를 사용하여 유효 기간의 다른 두 모델보다 약간 더 나은 것으로 나타납니다 이러한 통계적 결과만으로는 3 가지 모델 중에서 선택하기가 어려울 것입니다. 그러나 ARIMA 0,2,1 모델의 장기 예측을 계획하지 않으면 상수없이 본질적으로 LES 모델의 경우 이전 모델과 큰 차이가 있음을 알 수 있습니다. 예측 결과는 이전 모델보다 다소 상승 추세가 적습니다. 이는 시리즈 마지막 단계의 지역 경향이 평균 경향보다 약간 적기 때문입니다 시리즈 전체 - 하지만 신뢰 구간 훨씬 더 신속하게 확대 두 차수의 차수를 가진 모델은 계열의 추세가 시간에 따라 변하는 것으로 가정하므로 한 차수의 차수를 가진 모델보다 먼 미래를 훨씬 더 불확실한 것으로 간주합니다. 어떤 모델을 선택해야합니까? 이는 데이터 트렌드의 일정성과 관련하여 우리가 편하게 생각할 수있는 가정에 달려 있습니다. 한 차수의 차수를 가진 모델은 일정한 평균 추세를 가정합니다. 이것은 본질적으로 성장이 미세 조정 된 임의 워킹 모델입니다. 따라서 상대적으로 보수적 인 추세 예측을합니다. 두 개 이상의 차수를 갖는 모델은 시간에 따라 변하는 지역 추세를 가정합니다 - 본질적으로 선형 지수 평활화 모델입니다 - 그리고 추세 예측은 다소 변덕 스럽습니다. 이런 종류의 상황에서 일반적으로 차수가 낮은 차수의 모델을 선택하는 것이 좋습니다. 다른 것들은 대략 같음 실제로 무작위 걸음 또는 단순 지수 평활화 모델은 종종 선형 지수 평활화 모델보다 더 잘 작동하는 것처럼 보입니다. 혼합 모델 대부분의 경우, 최상의 모델은 AR 용어 만 사용하거나 MA 용어를 사용하지만 AR 및 MA 조건을 모두 포함하는 혼합 모델이 데이터에 가장 잘 부합 할 수도 있지만 혼합 모델을 적용 할 때는주의를 기울여야합니다 AR 용어와 MA 용어가 서로를 취소 할 수 있습니다 예를 들어, 시계열에 대한 올바른 모델이 ARIMA 0,1,1 모델이라고 가정하지만 대신 ARIMA에 적합하다고 가정합니다. 1,1,2 모델 - 즉 하나의 추가 AR 용어와 하나의 추가 MA 용어를 포함하는 경우 추가 조건이 모델에서 중요하게 나타날 수 있지만 내부적으로는 상호 작용할 수 있습니다. 결과 매개 변수 추정치가 모호 할 수 있습니다 , 매개 변수 추정 과정은 매우 많은 예를 들어 10 개 이상의 반복을 취할 수있다. 규칙 8 AR 용어와 MA 용어는 서로의 효과를 상쇄 할 수 있으므로 혼합 된 AR-MA 모델이 데이터를 사용하는 경우 AR 기간이 하나 적은 모델과 MA 조건이 적은 모델을 시도하십시오. 특히 원본 모델의 매개 변수 추정치가 수렴하기 위해 10 번 이상 반복해야하는 경우 특히 그렇습니다. 따라서 ARIMA 모델은 다음을 포함하는 역 단계 식 접근 방식으로 식별 할 수 없습니다. 다시 말해, AR과 MA의 두 가지 용어는 서로 다른 종류의 용어를 여러 개 포함시킨 다음 추정 계수가 중요하지 않은 것을 제외하는 것으로 시작할 수 없습니다. 대신에 일반적으로 순방향 단계적 접근법을 따라 한 종류의 용어 또는 다른 용어를 ACF 및 PACF 플롯의 모양으로 표시됩니다. 단위 근원 계열이 지나치게 과다 또는 과다 참조되는 경우 - 즉 차별화의 전체 순서를 추가하거나 취소해야하는 경우가 많습니다 그는 모델의 AR 또는 MA 계수를 추정 AR 1 모델은 추정 된 AR 1 계수가 거의 정확히 1과 같으면 단위근을 갖는다 고 말합니다. 정확하게 같으면 실제로 계수의 측면에서 의미있는 차이가 없음을 의미합니다. 오류가 발생하면 AR 1 용어가 첫 번째 차이를 정확하게 모방한다는 것을 의미합니다. 이 경우 AR 1 용어를 제거하고 차등 순서를 추가해야합니다. AR 1 모델을 앞서 언급 한 undifferenced UNITS 시리즈 고 차원 AR 모델에서 AR 계수의 합이 1 인 경우 단위 루트가 모델의 AR 부분에 존재합니다. 이 경우 AR의 순서를 줄여야합니다 term을 1로 설정하고 differencing의 순서를 추가합니다. AR 계수의 단위근을 갖는 시계열은 고정적이지 않습니다. 차분의 차수가 더 높아야합니다. 규칙 9 모델의 AR 부분에 단위근이있는 경우 - 즉, AR 계수들의 합이 거의 정확히 1 - AR 항의 수를 1 줄이고 차분의 차수를 1 씩 증가시켜야합니다. 마찬가지로 MA 1 모델은 추정 된 MA 1 계수가 정확히 1과 같으면 단위근을 갖습니다. MA 1 용어가 첫 번째 차이를 정확히 취소한다는 것을 의미합니다. 이 경우 MA 1 용어를 제거해야하고 차등화 순서를 1 씩 줄여야합니다. 상위 MA MA 모델에서 MA 계수의 합은 정확히 1과 같습니다. 규칙 10 모델의 MA 부분에 단위근이있는 경우 - 즉 MA 계수의 합이 거의 정확히 1 인 경우 - MA 항의 수를 줄여야합니다 예를 들어, 선형 지수 평활화 모델 인 ARIMA 0,2,2 모델에 적합한 경우, 간단한 지수 평활화 모델 ARIMA 0,1,1 모델이면 충분할 것입니다. 2 개의 MA 계수의 합이 1과 거의 동일하다는 것을 알 수있다. MA 순서를 감소시킴으로써 d 각각의 차수의 차수에 따라 더 적절한 SES 모델을 얻습니다. 추정 된 MA 계수의 단위근을 가진 예측 모델은 모델의 잔차가 진정한 무작위 잡음의 추정치로 간주 될 수 없다는 것을 의미하는 비역 수식이라고합니다 단위 근원의 또 다른 증상은 모델의 예측이 폭발하거나 그렇지 않으면 기괴하게 행동 할 수 있다는 것입니다. 모델의 장기 예측의 시계열 그림이 이상하게 보일 경우 모델의 추정 계수를 확인해야합니다. 규칙 11 장기 예측이 불안정하거나 불안정한 경우 AR 또는 MA 계수에 단위근이있을 수 있습니다. 이 두 모델은 여기에 적합하지 않습니다. ACF와 PACF 모델을 연구함으로써 적절한 차수의 차수와 적절한 수의 AR 및 MA 계수로 시작하는 데주의를 기울였습니다. A와 A 사이의 단위근 및 취소 효과에 대해 자세히 설명합니다. R 및 MA 용어는 ARIMA 모델 유인물의 수학 구조에서 찾을 수 있습니다. RIMA는 Autoregressive Integrated Moving Average 모델을 나타냅니다. Univariate single vector ARIMA는 자체 관성에 기반하여 시리즈의 미래 가치를 예측하는 예측 기법입니다. 주요 응용 프로그램 최소 40 개의 과거 데이터 포인트가 필요한 단기 예측 영역입니다. 데이터가 비정상적인 양의 비정상적인 양으로 안정적이거나 일관된 패턴을 보일 때 가장 잘 작동합니다. 원저자가 작성한 Box-Jenkins라고 불리는 ARIMA는 일반적으로 데이터가 상당히 길고 과거 관측치 간의 상관 관계가 안정적 일 때 지수 스무딩 기법 데이터가 짧거나 변동이 심하면 약간의 스무딩 방법이 더 잘 수행 될 수 있습니다 38 개 이상의 데이터 포인트가없는 경우 다른 방법을 고려해야합니다 ARIMA 방법론을 적용하는 첫 번째 단계는 안정을 확인하는 것입니다. 정지 상태는 시간이 지남에 따라 상당히 일정한 수준으로 유지됩니다. 대부분의 경제 또는 비즈니스 응용 프로그램과 마찬가지로 추세가 존재하면 데이터가 고정되지 않습니다. 데이터는 또한 시간에 따른 변동에 일정한 변동을 보여야합니다. 무겁게 계절적으로 성장하고 더 빠른 속도로 성장한다. 그러한 경우, 계절에 따른 흥망 성쇠는 시간이 지남에 따라 더욱 극적으로 변할 것이다. 이러한 안정 상태가 충족되지 않으면 프로세스와 관련된 많은 계산이 계산 될 수 없다. 데이터가 nonstationarity를 ​​나타냅니다, 당신은 시리즈를 다르게해야합니다 Differencing은 비 정적 시리즈를 고정 된 것으로 변환하는 훌륭한 방법입니다. 이는 이전 기간의 관찰을 현재 기간에서 뺀 것입니다. 이 변환이 시리즈에 한 번만 수행되면 , 당신은 데이터가 처음으로 차이가 난다고 말합니다. 이 과정은 본질적으로 시리즈가 상당히 일정한 속도로 커지고있는 추세를 제거합니다. 증가하는 속도로 성장하고 있으며, 동일한 절차를 적용하고 데이터를 다시 다르게 적용 할 수 있습니다. 그러면 데이터가 두 번째 차이가 날 것입니다. 자기 상관은 시간에 따라 데이터 계열이 자체와 어떻게 관련되는지를 나타내는 수치입니다. 보다 정확하게는 지정된 간격 수의 데이터 값이 시간의 경과에 따라 서로 얼마나 강하게 반응 하는지를 측정합니다. 간격의 수는 대개 지연 예를 들어, 래그 1의 자기 상관은 한주기가 서로 다른 값을 갖는 방식을 측정합니다. 래그 2의 자기 상관은 두 기간 간격으로 데이터가 서로 관련되어있는 방식을 측정합니다. 자동 상관은 1에서 -1까지의 값을가집니다. 1은 높은 양의 상관 관계를 나타내고 -1에 가까운 값은 높은 음의 상관 관계를 의미합니다. 이러한 측정은 correlagram이라는 그래픽 플롯을 통해 가장 자주 평가됩니다. correlagram은 서로 다른 래그에서 주어진 계열에 대한 자기 상관 값을 표시합니다. 자기 상관 함수이며 ARIMA 방법에서 매우 중요합니다. ARIMA 방법론은 자기 회귀 및 이동 평균 매개 변수라고 불리는 것에 대한 정지 된 시계열 이들은 AR 매개 변수로 자동 반복 및 MA 매개 변수 이동 평균이라고 함 1 매개 변수 만있는 AR 모델은 조사 대상 X 시간 시리즈로 쓸 수 있습니다. 시계열이 1 기간에 뒤떨어지면 1.X t-1의 자기 회귀 매개 변수. 모델의 오차항. 이것은 단순히 임의의 주어진 값 X t가 이전 값의 일부 함수 X t - 1과 설명 할 수없는 임의의 오류를 더한 것 E 1의 추정 된 값이 30이라면 그 시리즈의 현재 값은 그 값의 30과 관련이 있습니다 1 시간 전 물론 시리즈는 단지 1 과거 값 예 : X t A 1 X t-1 A 2 X t-2 E t. 이것은 시리즈의 현재 값이 직전의 두 값 X t-1과 X t - 2, 몇 가지 임의의 오류 E t 우리의 모델은 이제 주문의 자동 회귀 모델입니다. 2. 움직이는 에이버 박스 모델을 두 가지 유형의 Box-Jenkins 모델을 이동 평균 모델이라고 부릅니다. 이 모델은 AR 모델과 매우 유사하게 보이지만 그 개념은 매우 다릅니다. 이동 평균 매개 변수는 기간 t에서 일어나는 일을 무작위 오류와 관련시킵니다. Xt-1, E t-2 등의 과거 회기 기간에 발생했다. MA 회기가 하나있는 이동 평균 모델이 작성 될 수있다 용어 B 1은 차수 1의 MA라고 부른다. 매개 변수 앞의 음수 부호는 관례 목적으로 만 사용되며 대개 대부분의 컴퓨터 프로그램에 의해 자동 인쇄된다. 위의 모델은 주어진 X 값 t는 이전 기간의 무작위 오차 Et-1과 현재 오차 항 Et에 직접적으로 관련된다. 자기 회귀 모델의 경우처럼 이동 평균 모델은 다른 조합을 포함하는 고차 구조로 확장 될 수있다 이동 평균 길이. ARIMA 방법론 o 자동 회귀 및 이동 평균 매개 변수를 모두 포함하는 모델을 만들 수 있습니다. 이러한 모델은 종종 혼합 모델이라고도합니다. 더 복잡한 예측 도구를 만들지 만, 구조가 실제로 시리즈를 더 잘 시뮬레이트하고보다 정확한 예측을 생성 할 수 있습니다. 순수 모델 구조가 AR 또는 MA 매개 변수만으로 구성된다는 것을 의미합니다. 이 접근법에 의해 개발 된 모델은 자동 회귀 AR, 통합 I의 조합을 사용하기 때문에 일반적으로 ARIMA 모델이라고합니다. 예측을 생성하기 위해 차분의 역 과정을 참조하고, 이동 평균 MA 연산 ARIMA 모델은 대개 ARIMA p, d, q로 표시됩니다. 이는 자동 회귀 컴포넌트 p의 순서, 차이 연산 자 수 d 및 이동 평균 기간의 가장 높은 순서를 나타냅니다. 예를 들어, ARIMA 2, 1,1은 당신이 1 차 이동 평균 성분을 가진 2 차 자동 회귀 모델을 가지고 있다는 것을 의미합니다. 올바른 사양을 선택하십시오. 고전 Box-Jenkins의 주요 문제점은 사용할 ARIMA 사양을 결정하려고합니다. 얼마나 많은 AR 및 / 또는 MA 매개 변수를 포함해야합니까? Box-Jenkings 1976의 상당 부분이 식별 과정 그것은 샘플 자기 상관과 부분 자기 상관 함수의 그래픽 및 수치 평가에 달려있다. 기본 모델의 경우, 작업은 그리 어렵지 않다. 각각은 특정한 방식으로 보이는 자기 상관 함수를 가지고있다. 그러나, 당신이 복잡성을 가질 때 패턴을 쉽게 감지 할 수 없습니다. 문제를 더욱 어렵게 만들려면 데이터가 기본 프로세스의 샘플 만 나타냅니다. 즉, 샘플링 오류 아웃 라이어, 측정 오류 등이 이론적 식별 프로세스를 왜곡시킬 수 있습니다. 따라서 전통적인 ARIMA 모델링은 예술입니다 과학보다는 오히려.

No comments:

Post a Comment