시계열 분석법.시계열이란 시간에 따라 일정한 간격(시간, 주, 월, 분기, 연도별)으로 구해진 관찰자료의 간격 순서이다. 이렇듯 시간의 흐름에 따르는 과거의 변화에 근거를 두고 미래의 변화를 예측해 보려고 하는 예측기법이 시계열 기법(time-series method)이다. 예컨대 수요량, 이윤, 사고건수, 강수량, 생산성 및 소비자 가격지수 등을 시계열에 의해 측정하게 된다.1단순예측법(naive approach): 가장 최근의 자료를 다음 기의 예측지로 사용한다.예를 들어 내일 날씨는 오늘 날씨와 같을 것이라는 예측은 약 70%는 정확하다는 것이다. 일반적으로 미국 기상대에 의한 일기예보는 90% 가량 적중한다. 단순 예측법은 관찰치가 기간에 따라 변동이 거의 없다면 아주 간단하다. 대체로 이러한 접근법은 많은 경우에 잘 맞지 않는다. 그러나 그러한 경우에도 다른 예측대제안의 표준을 제공함으로써 유용한 목적을 가진다.2이동평균법(moving average): 최근의 실적치의 합계를 평균함으로써 개별관측치의 높고 음이 서로 상쇄되기 때문에 시계열에서 변동을 평활한다. 이동평균은 새로운 관찰치를 이용하고 오래된 자료를 버려, 반복적으로 새로운 평균을 유지한다. 이동평균의 유형은 단순이동평균과 가중이동평균의 두가지가 있다.단순 이동평균은 가장 최근의 일정기간에 대해 시계열의 평균치를 계산하여 다음 기의 예측으로 이를 이용한다. 그러므로 3기간의 이용평균은 최근 3기간의 관찰치를 평균하다.가중이동평균은 최근자료일수록 더 많은 가중치를 준다. 가중이동평균의 장점은 오래된 자료에 대한 최근의 자료보다 중요성을 적게 둠으로써, 즉 가중치의 선택에 의해 환경변화를 민감하게 반영할 수 있다는 점이다. 그러나 가중치의 선택은 다소간 임의적이며 시행착오를 일으킬 수 있다. `이동평균법은 사용자가 주의해야 할 기본적인 특징은 첫째, 자료에 포함된 변동을 평활하는 것이고 둘째, 자료의 변동패턴에 즉각적으로 반영되지 않는다는 것이다.3지수평활법(exponential smoothing method): 가장 최근의 자료는 가장 큰 가중치가 주어지며 자료가 오래된 것일수록 가중치가 지수적으로 감소하기 때문이다. 가중이동법보다 우월한 기법이지만 실제로는 가중이동법의형태이다.새로운 예측치=전기의 예측치+a(전기의 실제값-전기의 예측치)a는 비율이고 (실제값-전기의 예측치)는 예측오차를 나타낸다.시계열자료에서 지수적 예측의 변화형태는 전적으로 평활상수의 값에 달려 있다. 전형적인 값은 0.1 내지 0.5이다. 작은 평활상수는 실제치와 예측치 사이의 차이를 늦게 반영하게 하여 0.5에 가까운 상수는 실제치와 예측치의 차이를 빨리 반영하게 한다.a=0.4인 평활지수는 a=0.1 보다 갑작스런 변화를 더 신속히 예측에 반영하게 할 것이다. 즉 수요의 증가속도가 빠르면 빠를수록 높은 지수 평활계수를 사용하고 안정될수록 낮은 사용해야 한다.평활지수의 선택은 미래변화가 주로 무작위 변동을 반영할 것이라고 예측자가 느끼는 정도와 실제변화(서로 다른 평균으로 이동)가 일어나는 정도에 달려 있다. 평활상수의 선택은 자료의 변동에 대한 반응비용과 비교하여 실제변화에 대응하지 못함으로써 발생하는 상대적 비용으로 요약할 수 있다.단순지수평활법의 중요한 한계점은 장기적 상승 또는 하향추세를 나타내는 자료에 부적합한 것이다. 그러한 경우에 단순지수평활법의 사용은 상승추세에 대해서는 너무 낮은 예측을, 하향추세에 대해서는 너무 높은 예측을 하게 만드는 것이다. 그러므로 추세가 시계열자료에 내포되어 있을 때 단순지수평활법은 사용치 말아야 한다. 그 대신 조정된 지수평활법을 사용해야 한다.추세조정 지수평활법(exponential smoothing adjusted for trend)는 두 번평활하는 방법이다. 먼저 원자료를 단순평활법으로 평활한 다음 평활된 자료를 다시 원자료를 평활하듯이 평활한다. 이러한 이중 평활치는 두가지 유용한 성질이 있다. 하나는 이중 평활된 예측치는 추세를 더욱더 잘 나타내는 것을 뜻하며 단순평활보다 더 많이 평활된다는 것이다. 다른 특성은 단순평활이 원자료를 지연시키듯이 이중 평활은 단순평활치를 지연시킨다. 그러므로 단순평활치와 이중평활치의 차이를 단순평활치에 더함으로써 얻어진 결과는 원자료와 유사한 것이다. 마지막으로 예측에 추세를 조정함으로써 미래 예측치의 훌륭한 지표를 제공하게 될 것이다.4시계열 분해법4가지 구성요소로 분해된다.1추세는 자료에서 점진적, 장기적 변화 등을 의미한다. 이러한 예로는 인구추이, 소득변화 및 문화적 변화 등이다.2계절성은 일반적으로 공휴일 및 방학 등과 같은 인위적 요인 또는 날씨요인과 관련된 단기적ㆍ규칙적ㆍ기간적 변동을 말한다. 식당, 슈퍼마켓, 극장 등은 매주 또는 매일의 계절성 변동을 나타낸다.3순환성은 1년 이상 지속되는 파도와 같이 순환되는 변동이다. 이러한 순환성은 다양한 경제성ㆍ정치적 요인 또는 기후조건 등과 관계를 맺고 있다.4무작위 및 불규칙적 변동은 다른 요인들이 고려된 후에도 남아 있는 잔여 변동요인이다. 불규칙성은 우연한 요인은 물론, 파업 및 다른 비정상적인 사건에도 기인한다.분해법의 핵심은 다양한 요소를 분리하여 그 요소들의 효과를 따로 분석할 수 있다는 것이다. 어떤 경우는 요소 모두보다는 어느 한 요인에만 초점을 맞춘다. 예를 들어 백화점의 구매자는 단기적 계획에 의해 구매한다기 보다는 요소의 계절적 변동과 관계가 있다고 할 수 있다. 또 재무계획 및 설비투자계획은 대체로 순환적 변동과 장기적 예측을 고려한다. 이들 요소들이 어떻게 결합되어 있는가에 따라 두 가지 모형이 있다.덧셈모형은 각 요소들의 합으로 시계열을 처리한다. Y=T+S+C+r곱셈모형은 각 요소들의 곱으로 시계열을 인식한다. Y=T*S*C*r여기에서 T=추세요소, S=계절요소, C=순환요소, r=잔차 이다.덧셈모형에서 각 요인은 실제값인 반면 곱셈모형에서는 단지 추세팀만 실제치이고 다른 요인은 추세의 퍼센트로 나타낸다. 실제로 곱셈모형이 덧셈모형보다 더 많이 쓰인다. 곱셈모형에 의해 수요를 예측하는 과정을 설명하면 먼저 시계열 추세요소는 방정식을 도출하는 것이다. 추세요소는 일반적으로 선형이지만 비선형일 수도 있다.선형추세서은 최소자승법(least spuare method)으로 구할 수 있다. 추세선의 직선방정식은 y=a+bt이다. t=1, 2, 3,... b=직선의 기울기 a=t가 0일 때 y의 값이때 방정식의 계수 a, b는 다음 식으로 구한다.{b= {n SUM ty- SUM t SUM y } over {n SUM t }, {a= { SUM y-b SUM t } over {n }여기서 n=관찰자료수다음은 계절성, 곧 계절지수는 시계열의 값이 계절적인 요인으로 인해 추세로부터 변동하는 정도를 나타내 준다. 이 계절지수는 추세에 대한 백분율로 나타낼 수 있으며 각 계절에 대하여 하나의 지수값을 갖는다. 곱셈모형을 이용하여 계절지수를 구할 수 있다. 먼저 Y=T*S*C*r에서 순환변동 C는 계절변동 S값을 확장하여 구할 수 있을 것이므로 여기에서 일단 제거하면 Y=T*S*r가 된다. 이 방정식의 양변을 추세값으로 나누어 주면 다음과 같은 계절변동 및 불규칙변동값만 남게 된다.{{Y } over {T }= {T*B*r } over {T }=S*r이때 r은 불규칙 찬차이므로 결국 계절변동 S값을 구할 수 있다.인과모형 분석법.인과형 기법을 사용할 수 있는 기본 전제는 결과변수의 예측보다도 원인변수의 예측이 더 쉬어야 한다는 점이다. 예를 들어 자동차의 수요를 예측하고자 하는데 자동차의 수요량에 영향을 미치는 것은 소득소준이라고 밝혀졌다고 하자. 여기서 회귀분석을 적용한다면 원인변수인 소득수준의 변화에 따라서 결과변수인 자동차의 수요가 결정되어진다는 가정을 하고 있는 셈이다.인과형분석 기법에 비교한다면 시계열분석 기법은 상당히 엉성한 방법이라고 평가할 수 있을 것이다. 원인 없는 결과가 있을 구 없는데 어떻게 원인에 대해서 분석할 생각은 못하고 시간에 흐름에 대해서만 변화가 이루어진다고 볼 수 있을 것인가? 그러나 현실적으로 많은 자연현상들이 시간에 대해서 안정적인 변화추세를 보이고 있으므로 시계열분석의 실용성이 결코 무시되어서는 안 될 것이다. 인구나 물가와 같은 것이 좋은 예이다. 다만 시계열분석에서 시간에 따른 변화를 추세선으로 나타낼 때 계산하는 방법이 인과모형의 단순회귀분석과 같아진다는 점은 혼동하기 쉬우므로 유의할 필요가 있다.원인변수를 시간으로 삼느냐, 아니면 다른 특정의 변수로 삼느냐에 따라 시계열분석과 인과모형분석으로 구분할 수 있다. 그러므로 다음에 설명하는 단순회귀모형의 예에서 독립변수에 시간을 대치시킨다면 시계열분석의 추세선추정 기법과 같다는 것을 알 수 있을 것이다.한편 상관분석은 회귀분석에서 파생된 것으로서 두 변수를 확률변수로 취급하고 두 변수 사이의 관련정도, 즉 두 변수가 얼마나 밀접하게 관련되어 있는가를 분석하는 기법이다.1회귀분석(regression analysis): 독립변수와 종속변수 사이에서 존재하는 함수관계를 나타내는 회귀방정식을 설정하고 독립변수의 특정한 값으로부터 종속변수의 값을 추정하는 기법이다.종속변수와 이에 가장 큰 영향을 미치는 하나의 독립변수와 관계를 규명하는 경우를 단순회귀분석(simple regression analysis)이라 한다.회귀방정식은 다음과 같은 표현할 수 있다. 이러한 예측 방정식은 시간과 관계를 갖는 것이 아니므로 계절 및 순환변동의 조정은 보통 이루어지지 않는다.{Y'=a+bXY'=종속변수의 추정치a=Y축의 절편, 즉, X=0일 때 Y'의 값b=회귀선의 기울기 X=독립변수의 주어진 값회귀방정식의 매개변수 a와b값은 시계열분석에서 설명할 수 최소자승법을 사용하여 구하는데 그들을 계산하는 공식은 다음과 같다.{b= {n SUM XY- SUM X SUMY } over {n SUM X²-( SUM X²) }{a= { SUM Y-b SUMX } over {n }회귀방정식으로부터 구한 추정치의 신뢰도를 판단하기 위해서는 회귀선 주위에 점들이 산포되어 있는 정도의 회귀의 표준편차, 즉 추정표준오차를 측정하여야 한다.