해피캠퍼스 토픽위키

토픽위키

총 24개

연관순
조회순

- 연관순
- 조회순

방통대 통계데이터과학과 R데이터분석 A+

2025.01.24

1. 성과점수 분석 1. 연구 종료 시점에서의 성과점수(t2)의 상자그림을 성별로 나란히 그렸습니다. 그래프의 제목으로 본인의 학번을 넣었습니다. 2. 성별에 따라 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 성별에 따른 성과점수의 평균에 차이가 있는 것으로 나타났습니다(p-value = 0.04677<0.05). 3. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균을 구했습니다. 4. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 스트레...

2025.01.24
R데이터분석 출석수업 과제물 (2023, 만점)

2025.01.24

1. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...

2025.01.24
방송통신대학교 통계데이터학과) 파이썬과 R 출석수업과제물 (30점 만점 A+)

2025.01.26

1. R 데이터프레임 생성 R을 사용하여 name, height, weight 3개의 열을 갖는 데이터프레임을 생성하고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 2. 파이썬 딕셔너리 생성 x1, x2, x3 리스트를 사용하여 name, height, weight 키를 가진 파이썬 딕셔너리를 생성하였습니다. 3. 파이썬 데이터프레임 생성 파이썬에서 생성한 딕셔너리를 사용하여 데이터프레임을 만들고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 4. 파이썬 함수...

2025.01.26
방송통신대학교 통계데이터학과)바이오통계학 중간과제물 (30점 만점 A+)

2025.01.26

1. 모집단, 표본, 모수, 통계량 모집단은 우리가 알고 싶은 대상 전체를 의미하며, 표본은 모집단의 일부를 실제로 관측한 것을 말한다. 모수는 모집단 전체의 특성을 나타내는 값이고, 통계량은 표본의 특성을 나타내는 값이다. 이 문제에서 모집된 만 7세 아동 100명은 표본에 해당한다. 2. 히스토그램 그리기 R 프로그래밍을 이용하여 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그렸다. 이를 통해 데이터의 분포 특성을 시각적으로 확인할 수 있다. 3. 중앙값 구하기 R 프로그래밍을 이용하여 이 데이터에 포함된 156명 전체의...

2025.01.26
2023년 2학년 1학기 확률의 개념과 응용 출석과제 중간과제 만점 30점

2025.01.25

1. 확률의 역사 확률은 16세기부터 21세기 사이에 다양한 주요 사안들이 있었는데, 16세기에는 확률론의 시작으로 지롤라모 카르다노가 확률론을 체계화하기 시작했고, 17세기에는 파스칼과 페르마가 확률론에 대한 이론을 정립했으며, 베르누이 확률변수 이론이 정립되었다. 18세기에는 베이즈 정리가 등장하면서 확률론이 성숙기에 접어들었고, 19세기에는 라플라스에 의해 확률이 하나의 학문적 체계로 조직화되었다. 20세기에는 콜모고로프가 확률론의 공리적 기초를 확립하면서 확률론이 수학이론으로 자리잡게 되었다. 21세기에는 ICT와 인공지능 ...

2025.01.25
경영통계학 ) 최근 1년간 개봉한 영화 30개 분석

2025.01.29

1. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간 데이터를 수집하여 분석하였습니다. 빈도분포표와 히스토그램을 작성하여 데이터의 분포를 확인하였고, 평균, 중앙값, 최빈값을 계산하여 중심 경향성을 분석하였습니다. 중앙값이 가장 좋은 중심 측정치라고 판단하였는데, 그 이유는 중앙값이 특이값의 영향을 받지 않고 데이터의 중심을 잘 나타내기 때문입니다. 또한 데이터를 표준화하여 특이값을 확인한 결과, 1개의 특이값이 발견되었습니다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 부분입니다...

2025.01.29
경영통계학 ) (a) 영화 30개를 무작위로 골라 영화 제목과 상영시간(분)을 기록하시오. (b) 빈포분포표와 히스토그램을 작성하고, 히스토그램을 설명하시오

2025.05.07

1. 영화 상영시간 분석 이 프레젠테이션에서는 무작위로 선택한 30개의 영화 제목과 상영시간(분)을 기록하고, 이를 바탕으로 빈도분포표와 히스토그램을 작성하였습니다. 히스토그램 분석 결과, 상영시간이 110분과 130분인 영화가 가장 많은 것으로 나타났으며, 대부분의 영화가 110분에서 150분 사이에 분포하고 있습니다. 또한 상영시간이 200분인 영화도 포함되어 있습니다. 이를 통해 영화 상영시간의 분포와 특성을 파악할 수 있습니다. 2. 중심 척도 비교 이 프레젠테이션에서는 영화 상영시간의 평균, 중앙값, 최빈값을 계산하고, 이...

2025.05.07
데이터로부터 분포 추정하기

2025.05.09

1. 분포 추정 데이터 분석에서 가장 기본적인 작업 중 하나는 주어진 데이터로부터 분포를 추정하는 것입니다. 분포 추정은 데이터의 특성과 패턴을 이해하고, 통계적 추론과 예측을 위한 기반을 마련하는 핵심 과정입니다. 분포 추정은 주로 확률분포를 가정하고 해당 분포의 파라미터를 추정하는 과정으로 수행되지만, 때로는 데이터가 정규분포나 다른 특정한 분포를 따르지 않는 경우도 있습니다. 이럴 때는 비모수적인 방법이나 시각적인 평가를 통해 분포를 추정하는 것이 필요합니다. 2. 비모수적 방법 비모수적 방법은 통계학에서 사용되는 개념으로, ...

2025.05.09
최근 1년간 개봉한 영화 30개의 상영 시간 분석

2025.01.29

1. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간을 조사하여 빈도 분포표와 히스토그램을 작성하고, 평균, 중앙값, 최빈값을 계산하였다. 데이터를 표준화하고 특이값을 판단하였다. 분석 결과, 대부분의 영화가 100분에서 120분 사이의 상영 시간을 가지고 있으며, 평균보다 짧거나 긴 상영 시간을 가진 영화도 각각 1편씩 존재하는 것으로 나타났다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 요소입니다. 관객들의 선호도와 관람 행태를 이해하고 이를 바탕으로 영화 제작과 배급 전략을 ...

2025.01.29
기초확률론 매트랩 과제

2025.01.16

1. 동전 던지기 실험 이 과제에서는 MATLAB을 사용하여 동전을 10번 던지는 실험을 200번 반복하고, 앞면이 나오는 횟수를 계산하여 히스토그램을 그리고 수학적 확률과 비교하는 내용입니다. 앞면이 나올 확률을 1/2로 가정하고, 10번 던지는 실험을 200번 반복하여 앞면이 나오는 횟수의 분포를 확인하고 수학적 확률과 비교하는 것이 핵심 내용입니다. 1. 동전 던지기 실험 동전 던지기 실험은 확률과 통계 분야에서 널리 활용되는 기본적인 실험 방법입니다. 이 실험은 동전을 던져 앞면과 뒷면이 나오는 확률을 관찰하고 분석하는 것입...

2025.01.16

1 / 3