본문내용
1. 시계열 데이터 분석의 개요
1.1. 시계열 데이터의 정의와 특징
시계열 데이터는 일반적으로 금융, 공공 행정, 에너지, 소매 및 의료와 같은 많은 분야가 의해 좌우되는 데이터이다. 시계열이란 관측치가 시간 순서대로 배열된 데이터 셋을 말하며, 시간 경과에 따라 순차적으로 취해진 연속 데이터 포인트이거나 확률적 프로세스의 결과라고 할 수 있다. 즉, 시계열은 과거가 현재나 미래에 어떠한 영향을 미치는지를 다루는 분석 과정이다. 시계열 데이터의 대표적인 예로는 주가지수의 일별 종가, 주간 질병 감염 수, 주간 열차 사고 수, 일별 강우량, 센서 데이터(시간별 온도 측정값 등), 연간 인구 증가율, 다년간 기업의 분기별 수익 등을 들 수 있다. 시계열 데이터는 대부분 이산 시간으로 나타나며 각 점 간의 시간 차이는 같다. 또한 시계열의 가장 중요한 특징으로는 값의 장기 이동(추세), 계절 변동(계절성), 불규칙하거나 주기적인 구성 요소 등을 들 수 있다.
1.2. 시계열 데이터 분석의 역사적 발전
시계열 데이터 분석의 역사적 발전은 다음과 같다"
시계열 데이터 분석은 오랜 역사를 가지고 있으며, 다양한 학문 분야에서 지속적으로 발전해왔다. 인구통계학, 유전학, 천문학, 경제학, 기상학, 의학 등 여러 분야에서 시계열 데이터 분석이 중요한 역할을 해왔다.
인구통계학 분야에서는 아브라함 드 무아브르(Abraham de Moivre)가 정규분포와 확률론에 대한 연구를 수행했으며, 토마스 로버트 맬서스(Thomas Robert Malthus)는 인구 증가와 식량 생산 간의 관계를 연구했다. 아돌프 퀘틀렛(Adolphe Quetelet)은 범죄율, 결혼율, 자살률 등의 사회과학 데이터에 통계적 방법을 적용했고, 시메옹 드니 포아송(Simeon Denis Poisson)은 이산적 사건에 대한 확률 이론을 발전시켰다. 빌헬름 렉시스(Wilhelm Lexis)는 안정적인 시계열을 정의하고 분석하는 방법을 제시했다.
유전학 분야에서는 갈튼(Galton)이 상관관계 개념을 활용하여 인체 측정학을 발전시켰고, 피어슨(Pearson)은 유전의 맥락에서 생체 인식 기술을 적용했다. 로널드 피셔(Ronald Fisher)는 모방, 부모의 유전자 제공, 성비 등의 진화론적 주제에 대한 통계적 분석을 발전시켰다.
천문학 분야에서는 에드먼드 핼리(Edmund Halley)가 혜성의 궤도를 예측했고, 칼 프리드리히 가우스(Carl Friedrich Gauss)는 왜행성 세레스의 궤도를 결정하는 방법을 고안했다. 아드리앙 마리 르장드르(Adrien-Marie Legendre)는 최소제곱법을 천체 운동 분석에 적용했으며, 피에르시몽 라플라스(Pierre-Simon Laplace)는 중심 극한 정리를 증명했다.
경제학 분야에서는 윌리엄 플레이페어(William Playfair)가 다양한 시각화 기법을 개발했고, 베이즈(Thomas Bayes)는 사전 지식을 활용한 확률 정리를 제시했다.
기상학 분야에서는 로버트 피츠로이(Robert FitzRoy) 해군 부제독이 영국의 기상청을 설립했고, 존 모츨리(John Mauchly)와 J. 프레스퍼 ...