본문내용
1. 통계 자료 분석
1.1. 통계학의 개념 및 정의
통계학은 취득할 수 있는 데이터나 선별된 데이터로부터 정보를 얻어내는 하나의 방법론이다. 통계학은 확률적인 이론을 근거로 하여 표본에 대해 조사한 결과로부터 모집단의 상태를 추정할 수 있는 이론적 근거를 제시하여 주고 필요한 정보를 제공하여 준다. 통계학은 데이터를 수집, 정리, 분석하고 해석하는 학문으로 사회 현상이나 자연 현상 등을 연구하는데 기여한다. 통계학의 핵심 개념은 변인, 모집단, 표본, 추정, 추론 등이며 통계 분석을 통해 실험 결과의 일반화 및 예측이 가능하다. 따라서 통계학은 관찰된 데이터에서 결론을 이끌어내는 주요한 방법론이라 할 수 있다.
1.2. 데이터 유형별 평균 계산법
데이터 유형별 평균 계산법은 자료의 성격에 따라 다르게 적용된다. 대표적인 평균 계산법으로는 산술평균, 기하평균, 조화평균이 있다.
산술평균은 가장 일반적인 평균 계산법으로, n개의 변수들의 합을 n으로 나눈 값이다. 이산형 자료의 대표값으로 많이 사용된다.
기하평균은 시간의 경과에 따라 변화하는 값들의 평균을 계산하는데 사용된다. 예를 들어 물가, 주가, 인구증가율 등에 적용할 수 있다.
조화평균은 속도, 가격 등과 같이 역수로 해석할 수 있는 자료의 평균을 계산하는데 사용된다. 조화평균은 개별점수의 역의 산술평균의 역이다.
이처럼 산술평균, 기하평균, 조화평균은 각각 서로 다른 특성을 가지고 있으며, 자료의 성격에 따라 적절한 평균 계산법을 선택해야 한다. 일반적으로 산술평균 > 기하평균 > 조화평균 관계가 성립한다.
1.3. 도수분포표 작성 방법
도수분포표는 관찰된 자료를 일정한 구간으로 나누어 각 구간에 해당되는 자료의 개수를 파악할 수 있도록 하는 통계 기법이다. 도수분포표를 작성하는 순서는 다음과 같다.
첫째, 자료의 수(n)를 센다.
둘째, 자료의 최대값과 최소값을 구하고 범위(R)를 계산한다.
셋째, 자료의 최소단위(d)를 구한다. 최소단위는 자료가 표현되는 마지막 자리수를 의미한다.
넷째, 급의 수(m)를 결정한다. 일반적으로 급의 수는 에 가까운 정수로 한다.
다섯째, 급의 구간 폭(w)을 정한다. 구간 폭은 범위를 급의 수로 나눈 수에 가까운 정수로 한다.
여섯째, 계급의 경계치를 정한다. 최소단위의 1/2로 정한다. 첫 구간의 하한치와 상한치를 결정한다.
일곱째, 나머지 구간도 비슷한 방식으로 만든 후 각 구간에 해당되는 도수를 기입하고 도수분포율을 계산한다.
이처럼 체계적인 순서에 따라 도수분포표를 작성함으로써 자료의 특성을 효과적으로 파악할 수 있다.
1.4. 데이터 오차의 유형
데이터 오차의 유형에는 크게 두 가지가 있다. 체계적 오차와 불규칙 오차이다.
체계적 오차는 이론의 잘못, 측정기계의 부정확성, 또는 측정자의 버릇에 따른 오차로, 어떤 정해진 규칙에 얽매여 한쪽으로만 치우치게 되는 오차이다. 이러한 체계적 오차는 그 원인을 제거하고 수정하는 것으로 보정할 수 있다.
반면 불규칙 오차는 체계적 오차 등을 보정해도 남는, 원인을 찾을 수 없는 오차이다. 매 측정마다 다른 오차가 발생하므로 오차를 완전히 제거할 수 없다. 측정 환경의 변화 등이 불규칙 오차의 원인이 된다.
따라서 실험이나 데이터 분석을 수행할 때에는 체계적...