총 437개
-
모수적 추정을 통한 데이터 기반 분포 모형화 3 (Python 코딩)2025.05.131. 모수적 추정 모수적 추정을 통해 데이터를 반영하여 분포 모델을 도출하는 과정과 그 중요성에 대해 다루고 있습니다. 기본적인 수식 y = ax + b*sin(x)에서 a와 b를 임의로 바꾼 후 단 10개의 데이터를 생성하고, 이를 바탕으로 추정을 수행합니다. MCMC 샘플링을 통해 posterior 분포를 추정하고, 이를 시각화하여 파라미터의 불확실성과 추정치의 변동성을 확인합니다. 2. 데이터 기반 모델링 주어진 데이터를 바탕으로 모수적 추정을 수행하여 모델을 도출하는 과정을 설명하고 있습니다. 10개의 데이터만을 사용하여 비...2025.05.13
-
모수적 추정을 통한 데이터 기반 분포 모형화 1 (Python 코딩)2025.05.131. 모수적 추정 모수적 추정은 데이터를 특정 함수의 파라미터로 모델링하는 방법입니다. 일반적으로 미리 정의된 수학적 모델을 사용하며, 해당 모델의 파라미터를 추정하는 것이 목표입니다. 모수적 방법은 데이터가 적을 때에도 좋은 성능을 보이지만, 데이터의 분포가 모델의 가정과 정확히 일치해야만 정확한 결과를 얻을 수 있습니다. 2. 비모수적 추정 비모수적 추정은 데이터를 특정 함수의 파라미터로 제한하지 않고, 유연한 모델링을 수행합니다. 주어진 데이터에 적합한 모델 형태를 자동으로 선택하며, 복잡한 데이터 패턴을 캡처하는 데 유용합니...2025.05.13
-
확률론(probability theory) 의 효과적 활용법 중 한 가지를 주제로 선택하여, 장점을 주장하고 논리적 근거를 예시 등으로 구체적 제시한 후, 자신만의 고유한 의견으로 마무리 요약2025.01.121. 예측 모델링의 기본 원리와 적용 분야 예측 모델링은 확률론의 기본 원리를 활용하여 과거 데이터를 분석하고, 이를 통해 미래의 사건이나 결과를 예측하는 과정이다. 이 방법론은 데이터 과학, 통계학, 인공지능 분야에서 광범위하게 적용되며, 기업의 의사결정 과정을 지원하는 데 있어 핵심적인 역할을 한다. 예측 모델링의 핵심 원리는 과거 데이터에 내재된 패턴과 상관관계를 식별하고, 이를 활용하여 미래의 사건 발생 가능성을 수치로 표현하는 것이다. 이 과정에서 확률론은 불확실성을 수량화하고, 예측의 신뢰도를 평가하는 데 중요한 기반을 ...2025.01.12
-
이산확률분포에 대하여 요약하여 정리하시오2025.05.021. 이산확률분포 이산 확률 분포는 이산 랜덤 변수의 각 가능한 결과의 확률을 설명하는 통계 개념입니다. 이산 랜덤 변수는 값이 유한하거나 셀 수 없을 정도로 무한한 수의 값만 가질 수 있는 변수입니다. 이산 확률 분포에는 이항분포, 초기하분포, 포아송분포 등이 있습니다. 2. 이항분포 이항 분포는 고정된 수의 독립 시행에서 특정 수의 성공 확률을 설명하는 이산 확률 분포입니다. 각 시행은 두 가지 가능한 결과(성공 또는 실패)만 있고 성공 확률은 모든 시행에 걸쳐 일정합니다. 이항 분포는 시행 횟수(n)와 각 시행에서의 성공 확률...2025.05.02
-
이산확률분포: 이항분포, 포아송분포, 초기하분포 비교2025.11.151. 이항분포 이항분포는 성공과 실패 두 가지 결과가 있을 때 성공 확률이 일정하고 각 시행이 독립적인 분포입니다. 동전 던지기가 대표적 예시이며, 평균은 np, 분산은 np(1-p)로 계산됩니다. 큰 n일 때 정규분포에 근사하며, 이진 분류 문제와 성공률 측정에 활용되고 생물학, 의학, 경제학 등 다양한 분야에서 응용됩니다. 2. 포아송분포 포아송분포는 희귀한 사건이나 발생 빈도가 낮은 사건의 발생 횟수를 모델링하는 확률분포입니다. 사건 발생률이 일정하다는 가정을 기반으로 하며, 기대값과 분산이 모두 λ로 같다는 특징이 있습니다....2025.11.15
-
로그 정규분포 실습해보기 (파이썬예제 포함)2025.05.101. 로그-정규분포 로그-정규분포는 양수값을 모델링하기에 적합한 분포입니다. 불량율을 로그 변환한 후, 정규분포를 사용하여 모델링할 수 있습니다. 이 분포는 자연로그를 취한 값이 정규분포를 따른다고 가정하는 것이기 때문에, 불량율이 양수인 경우에 유용합니다. 로그 정규분포는 실제로 많은 현상에서 관찰되는 분포로서, 소득 데이터와 같은 경제적인 현상에서 자주 사용됩니다. 소득 분포의 경우, 대부분의 개인들이 상대적으로 낮은 소득을 가지지만, 일부 특정 개인들이 다른 사람들보다 훨씬 높은 소득을 가지는 경우가 발생할 수 있습니다. 로그...2025.05.10
-
데이터 모델링에 관한 소고2025.05.101. 데이터 모델링 데이터 모델링은 예를 들어 제조 공정에서 발생하는 다양한 변수와 상호작용을 이해하고 표현하기 위한 기술입니다. 이를 통해 우리는 불량 발생에 영향을 미치는 주요 변수들을 식별하고, 이러한 변수들 간의 관계를 파악할 수 있습니다. 데이터 모델링을 통해 불량 발생 원인을 정확하게 분석하고, 불량율을 예측할 수 있는 모델을 구축할 수 있습니다. 2. 문제의 단순화: 단일 변수 표현 다변수 데이터를 예를 들어, 면적, 두께 등과 같은 기본적인 물리량으로 하나의 값으로 표현함으로써, 다양한 변수 간의 복잡한 관계를 단순화...2025.05.10
-
[경영통계학 A+] 이산확률분포에 대해 요약하여 정리하시오.2025.01.171. 이산확률분포 확률분포란 확률변수 X가 특정한 값을 가질 확률을 나타내는 분포를 말한다. 이러한 확률분포는 확률변수의 종류에 따라 크게 이산확률분포와 연속확률분포로 나뉜다. 이산확률분포란 이산확률변수에 대응하는 확률분포를 말한다. 즉, 확률변수 x가 취하는 값이 이산집합이어서 유한집합이거나 가산일 때, 이에 대응하는 확률분포를 이산 확률분포라고 한다. 이항분포, 포아송분포, 기하분포, 초기하분포 등이 대표적인 이산확률분포다. 2. 이항분포 이항분포는 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산확률 분포이다...2025.01.17
-
몬테카를로 시뮬레이션으로 원의 면적 구하기 (파이썬코드예제 포함)2025.05.091. 몬테카를로 시뮬레이션 몬테카를로 추정(Monte Carlo estimation)은 통계학과 컴퓨터 과학 등 다양한 분야에서 널리 사용되는 추정 방법 중 하나입니다. 이 방법은 통계적인 시뮬레이션을 통해 확률적인 모델링을 수행하여 원하는 값을 추정하는 방식으로 작동합니다. 몬테카를로 추정은 랜덤 샘플링과 통계적 분석을 결합하여 정확한 결과를 얻기 어려운 문제를 해결하는 데 유용하게 사용됩니다. 2. 원의 면적 구하기 원의 면적을 구하기 위해서는 원 안에 몬테카를로 시뮬레이션으로 생성된 점들 중 원 안에 속하는 점들의 비율을 계산...2025.05.09
-
연속확률분포의 이론과 응용2025.11.171. 확률밀도함수(PDF) 확률밀도함수는 연속확률분포의 기본 원칙을 제공하며, 두 가지 중요한 조건을 만족해야 한다. 첫째, 부정적이지 않음으로 모든 값에 대해 음수가 아니어야 하며, 둘째, 단위 면적으로 전체 범위에서 PDF 곡선 아래의 영역이 1과 같아야 한다. 이 정규화 조건은 할당된 확률이 총 확률 1을 보장하며, 다양한 연속확률분포를 구성하고 해석하기 위한 기초를 형성한다. 2. 정규분포와 중앙한계정리 정규분포는 가우스 분포라고도 하며 가장 널리 사용되는 연속확률분포이다. 중앙한계정리(CLT)는 독립적이고 동일하게 분포된 ...2025.11.17
