소개글
"온라인 도서 대여시스템 데이터베이스 설계 2024학년도"에 대한 내용입니다.
목차
1. 시계열 데이터 분석 기법
1.1. 평활화(smoothing)
1.2. 차분(differencing)
1.3. 변수변환
2. A/B 검증
3. 네이버 데이터랩을 활용한 취미활동 분석
3.1. 20대 여성과 40대 여성의 취미활동 차이 분석
3.2. 분석 결과 및 의미있는 결론
4. 기후위기 부정론자 설득을 위한 데이터 시각화
4.1. 지도 기반 온도 변화 시각화 방법
4.2. 시각화를 위한 데이터 준비 및 분석
5. 참고 문헌
본문내용
1. 시계열 데이터 분석 기법
1.1. 평활화(smoothing)
시계열 데이터의 평활화(smoothing)는 주기가 짧은 변동요인, 즉 교란요인을 제거하여 시계열의 기조적 흐름을 파악하도록 해준다. 평활화에는 중심화 이동평균, 후방이동평균, 이중이동평균, 가중이동평균 등이 있으며, 이중 중심화 이동평균(centered moving average)이 가장 주로 이용된다.
경제시계열의 불규칙변동요인을 제거할 경우에는 주로 3기 중심화 이동평균을 이용하게 된다. 중심화 이동평균 시계열은 원래 시계열과 시차구조가 동일하다는 장점이 있다. 또한 이동평균항 수를 늘리면 시계열의 보다 장기적인 변동도 파악할 수 있다.
그러나 이동평균 과정에서 시계열의 처음이나 마지막 시점에서 자료가 없어 이동평균값을 구할 수 없으므로, 장기 이동평균을 이용하는 데 한계가 있다. 이 경우 시계열의 예측값을 구해 이동평균값을 구하거나, 가능한 자료만으로 이동평균을 구하기도 한다.
종합하면, 평활화는 단기 변동요인을 제거하여 시계열의 기조적 흐름을 파악할 수 있게 해주지만, 시계열의 시작과 끝 부분에서 자료 부족으로 인한 한계가 있다고 할 수 있다."
1.2. 차분(differencing)
차분(differencing)은 시계열의 장기적 변동을 제거하는 데 유용한 기법이다. 차분은 현재 시점 자료에서 과거 인접 시점의 자료를 차감하는 것을 의미한다. 시계열을 차분하면 추세변동이 시계열에서 제거되는 장점이 있지만, 단기변동이 증폭되어 시계열의 신호가 명확하지 못한 단점이 있다."
안정시계열은 시계열의 움직임이 구간이 달라지더라도 매 구간별 특성이 동일하다. 즉, 안정시계열은 평균과 분산이 시간에 따른 규칙적인 변화가 없고 주기적 변화도 없는 시계열이다. 반면 불안정시계열은 시계열의 평균 및 분산이 시간에 따라 변화하는 시계열이다. 경제시계열은 대체로 추세변동요인과 계절변동요인이 뚜렷한 불안정시계열이다. 따라서 불안정시계열 분석 시에는 차분이나 변수변환 등으로 안정시계열로 전환하거나 불안정시계열 선형 결합의 안정성을 확보하여 분석해야 한다."
예를 들어, 그림 2에서 (a)의 구글(Google) 주식 가격은 추세를 보이고 있는 불안정시...
참고 자료
데이터처리와 활용, 심송용 외 4인, KNOU PRESS, 2020
김연희(2019), 데이터베이스개론 2판, 한빛아카데미.
https://draw.io/
이긍희 외, 빅데이터의이해와활용, 한국방송통신대학교출판문화원, 2022.
이긍희 외, 예측방법론, 한국방송통신대학교출판문화원, 2023.
박서영, 이긍희(2023), 데이터시각화, 출판문화원.
에일린 닐슨, 실전 시계열 분석, 한빛미디어, 2021.
https://www.youtube.com/watch?v=pLqjQ55tz-U
https://otexts.com/fppkr/
https://wikidocs.net/233151