
총 136개
-
푸아송 분포 유도 및 특징2025.01.141. 푸아송 분포 푸아송 분포는 거의 일어나지 않는 사건에 대한 분포로 적절합니다. n = 1000000, p = 0.00001 인 경우 이항분포로 계산하기 어려워 푸아송 분포를 사용할 수 있습니다. 푸아송 분포는 수많은 사건 중 특정한 사건이 발생할 확률이 매우 적은 경우에 사용되며, 예시로 단위 길이당 DNA 가닥의 돌연변이 수, 특정 지역에서 일어나는 교통사고 건수 등이 있습니다. 2. 푸아송 분포의 유도 푸아송 분포는 특정 지역에서 하루에 일어나는 교통사고의 평균 횟수 λ = 5일 때, 교통사고가 하루에 7번 일어날 확률을 ...2025.01.14
-
정규분포의 특징 네 가지2025.01.141. 정규분포의 대칭성 정규분포는 종 모양의 대칭적인 분포를 보이며, 이는 분포의 좌우가 평균을 중심으로 대칭을 이룬다는 것을 의미한다. 이 대칭성은 데이터의 중심 경향성을 이해하는 데에 도움을 주며, 데이터를 모델링하고 예측하는 데에도 중요한 역할을 한다. 2. 정규분포의 평균, 중앙값, 최빈값 일치 정규분포에서는 평균, 중앙값, 최빈값이 모두 동일하다. 이는 분포의 모양이 평균을 중심으로 좌우 대칭이며, 양 끝으로 갈수록 값이 점차 감소하는 종 모양이기 때문이다. 이를 통해 데이터의 중심 경향성을 파악하고, 예측 모델을 구축하는...2025.01.14
-
데이터를 대표하는 값들의 종류와 특징에 대해 설명하고, 그 사례를 제시하시오2025.01.211. 데이터 대푯값 유형 데이터 대푯값에는 평균, 중앙값, 최빈값이 존재한다. 평균은 데이터의 평균값을 의미하며 산술평균과 가중평균이 있다. 중앙값은 데이터를 크기 순서로 늘어놨을 때 중앙에 놓이는 값으로 특별히 크거나 작은 변수값이 있을 경우 왜곡이 크지 않아 데이터의 대표값으로 주로 활용된다. 최빈값은 변수값 중 가장 빈도수가 큰 변수값으로 데이터를 몇 개 클래스로 분류했을 시 빈도수가 가장 많은 클래스로 일정 개수 이상의 데이터가 없다면 최빈값의 의미는 희박해진다. 2. 시사점 통계학의 사회적 기능은 자료를 수집해 수집된 자료...2025.01.21
-
인문,사회과학에서 통계학의 역할과 한계2025.01.221. 통계학의 역할과 필요성 인문/사회과학 연구에서 통계학은 데이터를 기반으로 한 의사결정 과정에 필수적이다. 통계학은 대량의 데이터를 체계적으로 정리하고 분석하는 방법을 제공하며, 이를 통해 특정 현상의 경향성을 파악하고 예측할 수 있게 한다. 또한 통계학은 변수를 통제하고 다양한 요인 간의 관계를 명확하게 이해할 수 있는 도구를 제공한다. 2. 통계학의 한계 통계학은 본질적으로 추론에 기반을 두기 때문에, 그 결과는 항상 일정한 확률적 한계를 가진다. 또한 통계적 분석 결과는 해석 과정에서 연구자의 주관이 개입될 가능성이 있으며...2025.01.22
-
이산확률분포와 연속확률분포의 차이점2025.01.021. 이산확률분포 이산확률분포는 이산적인 값을 갖는 확률변수에 따른 분포에 대해 설명하는 확률분포입니다. 이산확률변수는 무한하지 않은 값(유한 값) 혹은 셀 수 있는 값을 가질 수 있으며, 이산확률변수가 가질 수 있는 값 모두의 집단은 카운트가 가능합니다. 이산확률변수가 가지는 값을 가질 확률은 확률질량함수(Probability mass function, PMF)를 이용하여 지정됩니다. 2. 연속확률분포 연속확률분포(Continuous Probability Distribution)는 연속확률 변수(continuous random v...2025.01.02
-
연속확률분포에 대한 요약 정리2025.05.161. 연속확률분포 연속확률분포는 확률변수 X가 특정 구간 내에서 값을 가질 때 그 구간에서의 확률을 모두 합한 값이 1인 분포를 말한다. 대표적인 연속확률분포로는 정규분포, 표준정규분포, 포아송분포, 지수분포 등이 있다. 특히 정규분포는 통계학에서 가장 많이 사용되는 연속확률분포로, 평균값으로부터 좌우 대칭이며 중심극한정리에 의해 모든 모수들이 0 또는 양수일 때 그 모양이 결정된다. 2. 분산과 표준편차 분산은 확률변수 X의 평균으로부터 떨어진 거리로서 편차라고도 한다. 표준편차는 분산의 제곱근으로서 표본평균들의 분포상태를 파악하...2025.05.16
-
빅데이터와 통계학_탐구보고서_확통(세특)2025.01.111. 빅데이터와 통계학 빅데이터는 기존의 데이터 베이스 관리도구의 데이터 수집, 저장, 관리, 분석의 역량을 넘어서는 대량의 정형 또는 비정형의 데이터 세트 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 정보 통신 기술의 발달, 빅데이터에 대한 효율적인 저장 및 분석의 가능, 국가간 기술 격차 감소로 인해 빅데이터에 대한 관심이 높아지고 있다. 의료산업, 맞춤형 마케팅, 제조업 등 다양한 분야에서 빅데이터가 응용되고 있다. 따라서 빅데이터 시대에 가치를 추출하고 결과를 분석하는 분야와 밀접한 관련이 있는 ...2025.01.11
-
표본추출의 장단점 및 유형, 확률표집법 설명2025.05.071. 표본추출 표본추출은 연구 대상 전체 모집단을 대표할 수 있는 일부 표본을 추출하는 과정을 의미합니다. 표본추출의 장단점 및 유형에 대해 설명하고 있습니다. 단순무작위 표집, 체계적 표집, 층화표집, 집락표집, 편의표집, 유의표집, 할당표집, 눈덩이표집 등 다양한 표본추출 방법이 있으며, 이 중 확률표집법은 모집단의 모든 구성요소가 표본으로 선정될 확률이 동일한 방법입니다. 2. 확률표집법 확률표집법은 모집단의 모든 구성요소가 표본으로 선정될 확률이 동일한 표본추출방법입니다. 단순무작위 표집, 체계적 표집, 층화표집, 집락표집 ...2025.05.07
-
다양한 표본 추출 방법과 장단점 비교2025.05.071. 표본 추출 방법 통계학에서 표본 추출은 조사를 위한 표본 집단을 선정하는 과정으로, 전체 모집단을 대표하는 적절한 표본을 선정하는 것이 중요합니다. 다양한 표본 추출 방법이 개발되어왔으며, 이에는 단순 무작위 추출, 등간격 추출, 계층 추출, 집단 추출 등이 있습니다. 각 방법은 장단점이 있어 모집단의 특성과 조사 목적에 따라 적절한 방법을 선택해야 합니다. 2. 단순 무작위 추출 단순 무작위 추출 방법은 모집단에서 무작위로 추출하는 방법으로, 모든 개체가 동일한 확률로 추출되기 때문에 추출된 결과는 매우 대표성이 높습니다. ...2025.05.07
-
MCMC를 활용한 베이지안 추론 - 동전 던지기 문제의 확률 추정 (파이썬예제풀이 포함)2025.05.091. MCMC(Markov Chain Monte Carlo) MCMC는 머신러닝과 통계학 분야에서 중요한 역할을 하는 AI(인공지능) 기법 중 하나입니다. MCMC는 복잡한 확률분포를 추정하거나 샘플링하기 위해 사용되며, 특히 베이지안 추론과 관련된 문제에 유용하게 적용됩니다. MCMC는 몬테카를로(Monte Carlo) 방법과 마코프 체인(Markov Chain)을 결합한 알고리즘으로, 마코프 체인을 이용하여 탐색 공간을 효과적으로 탐색하고 샘플링을 수행합니다. 2. 동전 던지기 문제 동전 던지기 문제는 간단하면서도 직관적인 문제...2025.05.09