본문내용
1. 연습문제 풀이
1.1. 일련번호 부여
1.1.1. 난수표를 이용한 단순임의 추출
난수표를 이용한 단순임의 추출은 모집단의 각 항목에 대해 동일한 선택 확률을 갖는다는 특징이 있다. 이를 위해 무작위로 선택된 번호에 해당하는 데이터 값을 추출하는 방식을 사용한다.
문서에 제시된 바와 같이, 해당 방법은 3단계로 진행된다. 먼저 난수표에서 3자리씩 읽어 번호를 얻고, 그 번호에 해당하는 데이터 값을 추출한다. 두 번째로는 중복된 번호를 제거하여 고유한 번호만을 남긴다. 마지막으로 남은 번호에 해당하는 데이터 값을 최종적으로 추출하게 된다.
이러한 단순임의추출법은 모든 항목이 동일한 선택 확률을 가지므로, 편향되지 않은 대표성 있는 표본을 얻을 수 있다는 장점이 있다. 다만 실제 적용 시 항목들의 번호를 사전에 부여해야 하고, 중복 제거 과정이 필요하다는 점에서 번거로운 단점이 있다.
따라서 이 방법은 균등한 선택 확률이 필요하거나 편향을 최소화해야 하는 상황에서 유용하게 활용될 수 있다고 볼 수 있다. 다만 실제 표본 선정 과정에서는 다른 추출 방식과의 비교를 통해 가장 효율적인 방법을 선택하는 것이 중요할 것이다.
1.1.2. 엑셀 함수 =RANDBETWEEN()을 이용한 단순임의 추출
엑셀 함수 =RANDBETWEEN()을 이용한 단순임의 추출은 표본추출 방법 중 하나이다. 엑셀 함수 =RANDBETWEEN(1,48)을 통해 1부터 48까지의 범위에서 10개의 난수를 임의로 추출하고, 이에 해당하는 데이터 값을 추출하는 방식이다. 이는 모든 항목이 추출될 수 있는 동일한 확률을 가지는 단순임의추출의 원리를 따르는 것이다. 이 방법은 모든 항목이 균등한 확률로 추출될 수 있어 대표성이 높고, 추출 과정이 간편하다는 장점이 있다. 하지만 실제 숫자가 아니라 컴퓨터가 생성한 난수를 사용하므로 무작위성에 대한 신뢰도가 다소 낮을 수 있다는 단점도 있다. 따라서 엑셀 함수 =RANDBETWEEN()을 이용한 단순임의추출은 작은 규모의 표본을 빠르게 추출하는 데 적합한 방법이다.
1.1.3. 계통 추출
계통 추출은 모집단의 크기 N과 표본의 크기 n을 이용하여 k=N/n의 간격으로 매번 동일한 간격으로 표본을 추출하는 방식이다. 먼저 모집단 내에서 첫 번째 항목을 무작위로 선택한 후, 이후 항목들은 k번째 항목을 선택하는 방식으로 진행된다. 이를 통해 모집단 전체를 고르게 대표할 수 있는 표본을 추출할 수 있다.
계통 추출은 단순임의 추출에 비해 편의가 상대적으로 작고, 표본의 대표성이 높다는 장점이 있다. 또한 단순임의 추출에 비해 실행이 용이하다는 장점도 있다. 다만 모집단의 순서가 주기적이거나 반복적인 패턴을 가지고 있는 경우 편의가 발생할 수 있다는 단점이 있다.
계통 추출은 다양한 분야에서 널리 활용되고 있다. 예를 들어 여론조사에서 전화번호부의 전화번호를 일정한 간격으로 선택하여 표본을 추출하거나, 통계청의 각종 조사에서 가구명부에서 일정한 간격으로 가구를 선택하여 표본을 구성하는 데 사용된다. 또한 마케팅 조사에서 고객 데이터베이스에서 일정한 간격으로 고객을 선택하여 설문조사를 실시하는 데에도 활용된다.
계통 추출은 단순임의 추출에 비해 편의가 작고 대표성이 높다는 장점이 있지만, 모집단의 순서에 따라 편의가 발생할 수 있다는 단점도 있다. 따라서 연구 목적과 표본의 특성을 고려하여 적절한 표본 추출 방법을 선택하는 것이 중요하다.
1.1.4. 판단 추출
판단 추출은 조사자의 주관적인 판단에 따라 표본을 선정하는 방식이다. 이는 모집단의 특성을 잘 반영하지 못할 수 있어 대표성이 떨어지는 단점이 있다. 그러나 특정 목적을 위해 특정 집단을 선별하고자 할 경우에는 유용하게 활용될 수 있다.
문서에 따르면, 영화를 본 사람들 중 신세대와 기성세대를 가장 ...