
총 24개
-
데이터를 가지고 정규분포 근사하기2025.05.111. 정규분포 근사 데이터의 분포를 정규분포에 근사시키는 과정은 데이터 분석에서 중요한 부분을 차지합니다. 데이터의 정규성을 평가하는 첫 번째 단계로 시각적 확인이 필요하며, 히스토그램과 QQ 플롯을 통해 데이터와 정규분포의 일치 정도를 확인할 수 있습니다. 또한 샤피로-위크스 검정과 같은 수치적 정규성 검증 방법을 통해 데이터가 정규분포를 따르는지 통계적으로 평가할 수 있습니다. 정규성 검정은 통계적 분석의 기반이 되며, 적절한 모델링 선택과 데이터 변환 등의 조치를 취하는데 도움을 줍니다. 2. 정규분포 가정의 중요성 많은 통계...2025.05.11
-
방통대 통계데이터과학과 R데이터분석 A+2025.01.241. 성과점수 분석 1. 연구 종료 시점에서의 성과점수(t2)의 상자그림을 성별로 나란히 그렸습니다. 그래프의 제목으로 본인의 학번을 넣었습니다. 2. 성별에 따라 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 성별에 따른 성과점수의 평균에 차이가 있는 것으로 나타났습니다(p-value = 0.04677<0.05). 3. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균을 구했습니다. 4. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 스트레...2025.01.24
-
경영통계학 ) (a) 영화 30개를 무작위로 골라 영화 제목과 상영시간(분)을 기록하시오. (b) 빈포분포표와 히스토그램을 작성하고, 히스토그램을 설명하시오. (c) 평균, 중앙값, 최빈값을 계산하고, 이 중 가장 좋은 중2025.05.071. 경영통계학 경영은 일반적인 사람의 기준에서 봤을 때 기업을 대상으로 하므로 계량화하거나 지표로 나타내는 것에는 한계가 있다. 경영 성과에 대해서는 수익률이나 상장기업은 주가로 그 수치를 나타낼 수 있지만 마케팅적 측면에서 소비자의 선호나 인적 자원 관리 측면에서 직원의 성과 정도를 수치화하는 것은 쉽지 않다. 그리고 기업 내부에서 조사하는 것이기 때문에 객관적인 답이 도출되지 않을 수도 있다. 이러한 이유로 통계학이 경영에서 관심 받고 있는 이유이다. 통계학은 경영의 다양한 분야에서 활용할 수 있다. 먼저 생산하는 기업이라면 ...2025.05.07
-
데이터로부터 분포 추정하기2025.05.091. 분포 추정 데이터 분석에서 가장 기본적인 작업 중 하나는 주어진 데이터로부터 분포를 추정하는 것입니다. 분포 추정은 데이터의 특성과 패턴을 이해하고, 통계적 추론과 예측을 위한 기반을 마련하는 핵심 과정입니다. 분포 추정은 주로 확률분포를 가정하고 해당 분포의 파라미터를 추정하는 과정으로 수행되지만, 때로는 데이터가 정규분포나 다른 특정한 분포를 따르지 않는 경우도 있습니다. 이럴 때는 비모수적인 방법이나 시각적인 평가를 통해 분포를 추정하는 것이 필요합니다. 2. 비모수적 방법 비모수적 방법은 통계학에서 사용되는 개념으로, ...2025.05.09
-
방송통신대학교 통계데이터학과) 파이썬과 R 출석수업과제물 (30점 만점 A+)2025.01.261. R 데이터프레임 생성 R을 사용하여 name, height, weight 3개의 열을 갖는 데이터프레임을 생성하고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 2. 파이썬 딕셔너리 생성 x1, x2, x3 리스트를 사용하여 name, height, weight 키를 가진 파이썬 딕셔너리를 생성하였습니다. 3. 파이썬 데이터프레임 생성 파이썬에서 생성한 딕셔너리를 사용하여 데이터프레임을 만들고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 4. 파이썬 함수...2025.01.26
-
주사위 던지기 시뮬레이션과 질병 진단 확률 분석2025.01.251. 주사위 던지기 시뮬레이션 R 프로그램을 활용하여 주사위 던지기를 20번, 200번, 2000번, 20000번 실행하고 그 결과를 히스토그램으로 나타냈습니다. 주사위 던지기는 독립 시행이며 각 숫자가 나올 확률이 동일합니다. 시행 횟수가 많아질수록 그래프가 균일해지는 것을 확인할 수 있습니다. 2. 질병 진단 확률 계산 전체 인구의 3%가 질병을 앓고 있으며, 진단 키트 검사 결과가 양성일 때 이 사람이 질병에 걸렸을 확률을 계산했습니다. 질병에 걸렸을 때 진단 키트가 양성을 보일 확률과 질병에 걸렸을 확률을 곱한 뒤 진단 키트...2025.01.25
-
방송통신대학교 데이터정보처리 출석수업 과제2025.01.261. 총출생성비 총출생성비는 여자 인구 100명당 남자 인구로 나타내는 지표입니다. 서울시의 총출생성비는 2018년에 최대값인 107.9명을 기록했으며, 이후 지속적으로 감소하는 추세입니다. 반면 경기도의 총출생성비는 2022년에 106.3명을 기록하며 증가하는 추세입니다. 서울시의 평균 총출생성비는 105.7명, 경기도는 105명으로 서울시가 약간 높습니다. 2. 줄기-잎 그림 줄기-잎 그림은 데이터의 분포를 빠르게 파악할 수 있는 방법입니다. 이 그림에서 줄기는 10단위이고, 잎은 나머지 자리의 숫자입니다. 이 그림을 통해 점수...2025.01.26
-
통계적품질관리 ) 도수분포표와 히스토그램 작성2025.05.131. 도수분포표 작성 제공된 데이터를 바탕으로 적절한 계급의 수를 정하여 도수분포표를 작성하였습니다. 계급의 수는 8개로 정하였고, 계급 폭은 0.14cm로 설정하였습니다. 도수분포표에는 계급, 도수, 누적도수, 상대도수, 누적상대도수 등의 정보가 포함되어 있습니다. 2. 히스토그램 작성 도수분포표를 바탕으로 히스토그램을 작성하였습니다. 세로 막대형 그래프를 선택하고, 데이터 레이블을 추가하여 각 계급의 도수를 표시하였습니다. 또한 축 서식을 수정하여 계급 간격을 조정하였습니다. 3. 통계량 계산 도수분포표를 활용하여 평균, 중앙값...2025.05.13
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26
-
2023년 1학기 통계학개론 출석수업 중간과제 리포트 30점 만점2025.01.251. 히스토그램 그리기 12명의 학생이 읽은 책 수에 대한 히스토그램을 그렸습니다. 히스토그램을 통해 데이터의 분포를 시각적으로 확인할 수 있습니다. 2. 상자그림 그리기 12명의 학생이 읽은 책 수에 대한 상자그림을 그렸습니다. 상자그림을 통해 데이터의 다섯 수치 요약(최소값, 1사분위수, 중앙값, 3사분위수, 최대값)을 확인할 수 있습니다. 3. t 검정 12명의 학생이 읽은 책 수에 대한 t 검정을 수행했습니다. t 검정 결과 p-value가 매우 작게 나와 해당 데이터가 통계적으로 유의미하다고 해석할 수 있습니다. 4. 대응...2025.01.25