
총 24개
-
2023년 2학년 1학기 확률의 개념과 응용 출석과제 중간과제 만점 30점2025.01.251. 확률의 역사 확률은 16세기부터 21세기 사이에 다양한 주요 사안들이 있었는데, 16세기에는 확률론의 시작으로 지롤라모 카르다노가 확률론을 체계화하기 시작했고, 17세기에는 파스칼과 페르마가 확률론에 대한 이론을 정립했으며, 베르누이 확률변수 이론이 정립되었다. 18세기에는 베이즈 정리가 등장하면서 확률론이 성숙기에 접어들었고, 19세기에는 라플라스에 의해 확률이 하나의 학문적 체계로 조직화되었다. 20세기에는 콜모고로프가 확률론의 공리적 기초를 확립하면서 확률론이 수학이론으로 자리잡게 되었다. 21세기에는 ICT와 인공지능 ...2025.01.25
-
최근 1년간 개봉한 영화 30개의 상영 시간 분석2025.01.241. 영화 상영 시간 분석 본 과제는 최근 1년간 개봉한 영화 30개의 상영 시간을 분석하여 영화의 상영 시간에 대한 통계적 특성을 파악하는 것을 목적으로 한다. 빈도분포표와 히스토그램을 작성하고, 평균, 중앙값, 최빈값을 계산하여 가장 적합한 중심 측정치를 논의하며, 데이터를 표준화하여 특이값을 분석하고자 한다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 주제입니다. 관객들의 선호도와 관람 행태를 이해하고 이를 바탕으로 영화 제작과 배급 전략을 수립하는 데 도움이 될 수 있습니다. 상영 시간이 너...2025.01.24
-
방송통신대학교 데이터정보처리 출석수업 과제2025.01.261. 총출생성비 총출생성비는 여자 인구 100명당 남자 인구로 나타내는 지표입니다. 서울시의 총출생성비는 2018년에 최대값인 107.9명을 기록했으며, 이후 지속적으로 감소하는 추세입니다. 반면 경기도의 총출생성비는 2022년에 106.3명을 기록하며 증가하는 추세입니다. 서울시의 평균 총출생성비는 105.7명, 경기도는 105명으로 서울시가 약간 높습니다. 2. 줄기-잎 그림 줄기-잎 그림은 데이터의 분포를 빠르게 파악할 수 있는 방법입니다. 이 그림에서 줄기는 10단위이고, 잎은 나머지 자리의 숫자입니다. 이 그림을 통해 점수...2025.01.26
-
2024년 1학기 방송통신대 통계학개론 출석대체과제물2025.01.251. 히스토그램 히스토그램은 데이터의 분포를 시각적으로 나타내는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 히스토그램을 그릴 수 있습니다. 2. 상자그림 상자그림은 데이터의 중앙값, 사분위수, 최솟값, 최댓값 등을 한눈에 볼 수 있는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 상자그림을 그릴 수 있습니다. 3. 다섯수치요약 다섯수치요약은 데이터의 최솟값, 제1사분위수, 중앙값, 평균값, 제3사분위수, 최댓값을 나타내는 통계량입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 다섯수치...2025.01.25
-
기초확률론 매트랩 과제2025.01.161. 동전 던지기 실험 이 과제에서는 MATLAB을 사용하여 동전을 10번 던지는 실험을 200번 반복하고, 앞면이 나오는 횟수를 계산하여 히스토그램을 그리고 수학적 확률과 비교하는 내용입니다. 앞면이 나올 확률을 1/2로 가정하고, 10번 던지는 실험을 200번 반복하여 앞면이 나오는 횟수의 분포를 확인하고 수학적 확률과 비교하는 것이 핵심 내용입니다. 1. 동전 던지기 실험 동전 던지기 실험은 확률과 통계 분야에서 널리 활용되는 기본적인 실험 방법입니다. 이 실험은 동전을 던져 앞면과 뒷면이 나오는 확률을 관찰하고 분석하는 것입...2025.01.16
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26
-
데이터를 가지고 정규분포 근사하기2025.05.111. 정규분포 근사 데이터의 분포를 정규분포에 근사시키는 과정은 데이터 분석에서 중요한 부분을 차지합니다. 데이터의 정규성을 평가하는 첫 번째 단계로 시각적 확인이 필요하며, 히스토그램과 QQ 플롯을 통해 데이터와 정규분포의 일치 정도를 확인할 수 있습니다. 또한 샤피로-위크스 검정과 같은 수치적 정규성 검증 방법을 통해 데이터가 정규분포를 따르는지 통계적으로 평가할 수 있습니다. 정규성 검정은 통계적 분석의 기반이 되며, 적절한 모델링 선택과 데이터 변환 등의 조치를 취하는데 도움을 줍니다. 2. 정규분포 가정의 중요성 많은 통계...2025.05.11
-
통계처리와 측정오차 보정 결과보고서2025.04.261. 통계 처리 실험에서 얻은 데이터를 통계학적으로 분석하여 유의미한 정보를 얻어내고 데이터의 오차를 보정하는 방법을 알아보았다. 산술평균, 표준편차, 도수분포표, 히스토그램 등의 통계 기법을 사용하여 데이터를 분석하였다. 하지만 데이터의 수가 충분하지 않고 연령별 특성을 고려하지 않아 정규분포 모양이 나타나지 않았다. 향후 더 많은 데이터와 연령별 분석이 필요할 것으로 보인다. 2. 측정 오차 보정 최소자승법을 이용하여 임의의 입력값과 출력값 간의 관계식을 구하고 상관계수를 계산하였다. 그 결과 실험 자료를 잘 근사시킨 것으로 나...2025.04.26
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
데이터로부터 분포 추정하기2025.05.091. 분포 추정 데이터 분석에서 가장 기본적인 작업 중 하나는 주어진 데이터로부터 분포를 추정하는 것입니다. 분포 추정은 데이터의 특성과 패턴을 이해하고, 통계적 추론과 예측을 위한 기반을 마련하는 핵심 과정입니다. 분포 추정은 주로 확률분포를 가정하고 해당 분포의 파라미터를 추정하는 과정으로 수행되지만, 때로는 데이터가 정규분포나 다른 특정한 분포를 따르지 않는 경우도 있습니다. 이럴 때는 비모수적인 방법이나 시각적인 평가를 통해 분포를 추정하는 것이 필요합니다. 2. 비모수적 방법 비모수적 방법은 통계학에서 사용되는 개념으로, ...2025.05.09