본문내용
1. 서론
1.1. 벤포드의 법칙의 발견
1881년 캐나다 출신의 미국인 천문학자 사이먼 뉴컴은 낡은 로그표들을 살펴보던 중 1로 시작하는 수들의 로그 값이 나오는 첫 페이지가 9로 시작하는 수들이 등재된 마지막 페이지보다 더 너덜너덜했다는 것을 발견했다. 이는 1로 시작하는 수의 로그 값이 필요한 경우가 가장 많았기 때문이었다. 뉴컴은 이를 토대로 머리 숫자들이 로그함수에 따라 분포한다고 추측했다. 임의의 수가 d를 머리 숫자로 가질 확률은 log(d+1) - log d라고 주장했다. 그는 이 주장이 왜 옳은지 엄밀하게 증명하지는 않았지만 느슨하고 짧은 논증만을 제시했다.
그로부터 반세기가 지난 1938년, 뉴욕의 제너럴 일렉트릭 사에서 일하는 물리학자 프랭크 벤포드는 뉴컴의 발견을 다시 한 번 확인했다. 벤포드는 자신이 살펴본 모든 자료에서 1로 시작하는 수가 풍부하고 9가 드물다는 것을 발견했다. 그는 미국 도시들의 인구, 『미국 과학자American Men of Science』의 주소록, 원소들의 원자량, 강들의 면적 등 다양한 데이터를 분석했고, 대부분의 자료에서 그 패턴을 관찰할 수 있었다. 물론 정확한 비율은 아니었지만 예측된 비율과 실제 데이터는 대체로 10분의 몇 % 수준의 작은 오차 범위 내에서 일치했다. 벤포드는 이 현상이 어떤 보편적인 법칙을 반영하는 것이 틀림없다고 확신하며 이를 '이례적인 수들의 법칙'이라고 명명했다. 오늘날 이 현상은 '벤포드의 법칙'으로 불린다.
1.2. 벤포드의 법칙의 발견 배경
사이먼 뉴컴은 1881년에 『미국 수학 저널』에 실린 논문에서 낡은 로그표들을 살펴본 끝에 흥미로운 현상이 존재한다는 결론을 내렸다. 그가 발견한 현상은 어느 로그표를 보든지, 1로 시작하는 수들의 로그 값이 나오는 첫 페이지가 9로 시작하는 수들이 등재된 마지막 페이지보다 더 너덜너덜했다는 것이다. 이것은 사용자들이 로그표를 첫 페이지부터 읽어나가다가 재미가 없어서 중간에 그만 두었기 때문이 아니라, 1로 시작하는 수의 로그 값이 필요한 경우가 가장 많았기 때문이었다. 뉴컴은 이를 바탕으로 머리 숫자들이 특정한 비율로 분포한다고 추측했다. 그는 임의의 수가 d를 머리 숫자로 가질 확률이 log(d+1) - log d라고 주장했다. 하지만 그는 이 주장을 엄밀하게 증명하지 않고 느슨하고 짧은 논증만 제시했다. 이후 1938년, 프랭크 벤포드는 로그표에만 국한되지 않고 다양한 자료에서 같은 현상을 발견했다. 그는 이를 '이례적인 수들의 법칙'으로 명명했지만, 오늘날 이 현상은 '벤포드의 법칙'으로 불리게 되었다. 벤포드는 자연과학, 재정학, 경제학, 계산학 등 다양한 분야에서 이 법칙이 성립한다는 것을 보여주었다.
1.3. 탐구 동기 및 목적
벤포드 법칙을 사용하여 논문의 통계들을 분석하여 통계 조작이라는 부정 행위에 대한 의심을 제기하는 내용의 논문을 접하였다. 이를 계기로 벤포드 법칙이 무엇인지 알아보고자 하는 흥미가 생겼다. 확률과 관련된 내용인 벤포드 법칙이 기존의 일반적인 생각을 깨는 것...