본문내용
1. 주사위 던지기와 확률
1.1. 주사위 던지기 시행 횟수에 따른 히스토그램 분석
주사위를 던질 때 나오는 숫자는 1, 2, 3, 4, 5, 6의 6가지 경우이며, 각 숫자가 나올 확률은 1/6로 동일하다. 주사위를 10번 던질 경우, 각 숫자별로 다른 확률로 나타나는데 이를 히스토그램으로 표현하면 균일한 분포를 보이지 않는다. 하지만 주사위를 100번, 1,000번, 10,000번 던지게 되면 각 숫자가 나올 확률이 점점 1/6에 근접해 가는 것을 볼 수 있다.
10번 던진 결과를 히스토그램으로 나타내면 3이 나올 확률이 0.3, 6이 나올 확률이 0.4로 나타나며 다른 숫자들은 0.1의 확률로 나타난다. 이는 우연의 확률로 인해 특정 숫자가 더 많이 나오는 것을 보여준다.
하지만 주사위를 100번, 1,000번, 10,000번 던지게 되면 각 숫자가 나올 확률이 점점 1/6에 근접해 간다. 이는 확률이 상대도수의 극한을 의미한다는 것을 보여준다. 즉, 실험을 반복할수록 이론적 확률에 근접해 가는 것이다.
결론적으로 주사위를 던질 때 처음에는 우연의 확률로 인해 특정 숫자가 많이 나올 수 있지만, 주사위를 계속해서 던지다 보면 각 숫자별로 1/6의 확률로 수렴하게 된다. 이를 통해 확률은 상대도수의 극한을 의미한다는 점을 알 수 있다.
1.2. 베르누이 시행과 이항분포의 정규근사
베르누이 시행과 이항분포의 정규근사는 통계적 추론에서 중요한 개념이다. 베르누이 시행은 성공/실패로 나뉘는 독립시행을 의미하며, 이항분포는 n번의 독립 베르누이 시행의 합을 나타낸다.
이항분포 B(n,p)에서 n이 충분히 크고 p가 중간 값일 때, 이항분포는 정규분포 N(np, npq)에 근사하게 된다. 이는 중심극한정리에 의한 것으로, 표본의 크기가 커질수록 표본평균이 정규분포에 수렴하기 때문이다.
따라서 이항분포 B(20, 0.5)의 경우 n=20이 충분히 크고 p=0.5이므로, 정규분포 N(10, 5)에 근사한다고 볼 수 있다. 이를 확인하기 위해 1,000개의 난수를 생성하여 확률히스토그램을 그리고 정규분포 곡선을 겹쳐 나타내면, 두 분포가 매우 유사한 형태를 보이는 것을 알 수 있다.
이항분포의 정규근사는 통계적 추론에서 매우 유용하게 활용된다. 샘플 크기가 크고 성공확률이 중간 값일 때 정규분포를 사용하면 계산이 훨씬 간단해지기 때문이다. 특히 대표본 추론에서 이항분포의 정규근사를 활용하면 매우 유용한 통계적 추론이 가능하다.
1.3. 이변량 정규분포와 난수 생성
이변량 정규분포와 난수 생성은 확률과 통계에서 매우 중요한 개념이다. 이변량 정규분포는 두 개의 확률변수가 정규분포를 따르는 분포를 의미한다. 이러한 이변량 정규분포의 난수 생...