총 10개
-
R데이터분석 2024년 2학기 방송통신대 출석수업대체과제물)R ggplot2 패키지에 내장된 mtcars 데이터셋은 32개의 차종에 대한 정보를 담고 있다2025.01.261. 변속기 종류에 따른 연비 차이 검정 변속기의 종류(am)에 따라 연비(mpg)의 평균이 달라지는지 검정한 결과, p-value가 0.001374로 유의수준 0.05보다 작으므로 변속기 종류에 따라 연비가 차이가 있다는 것을 확인하였다. 2. 실린더 수에 따른 연비 분포 차이 실린더 수(cyl)에 따른 연비(mpg)의 분포 차이를 상자그림으로 나타내었다. 실린더 수가 증가할수록 연비가 감소하는 경향을 확인할 수 있다. 3. 실린더 수에 따른 연비 평균 차이 검정 실린더 수(cyl)에 따라 연비(mpg)의 평균이 달라지는지 검정한...2025.01.26
-
2024년 1학기 방송통신대 기말과제물 데이터시각화2025.01.251. 뉴스에 데이터 시각화 사례 이 데이터 시각화는 1900년부터 2018년까지 미국의 눈으로 본 세계에 대한 차트이다. 뉴욕 타임즈의 741,681개의 섹션 전면 헤드라인을 분석하여, 1900년부터 2018년까지 매월 전 세계에서 미국인들의 관심을 가장 많이 끈 국가가 어디인지 보여준다. 또한 각 연도와 관련하여 페이지의 좌측에는 해당 연도에 해당하는 헤드라인 기사를 3개 보여주면서, 실제로 어떤 이유에서 미국의 관심을 그 국가가 끌게 되었는지 알게 해준다. 흥미로운 사실은 20세기 초에는 영국의 주요 관심 국가였는데, 2000년...2025.01.25
-
데이터 시각화, 기말과제물 (2023 1학기, 30점 만점)2025.01.251. 데이터 시각화 사례 이 기사에서는 1981년부터 2023년까지의 바닷물 온도 데이터를 시각화 하였다. 연도별로 극지를 제외한 해수면의 온도 변화를 나타냈는데, 데이터 시각화를 통해 올해 해수면 수온이 관측이래 사상최고치를 기록하면서 기후위기의 위험성을 데이터를 통해 알리고 있다. 특히, 작년의 해수면 수온 데이터는 주황색으로, 예년의 해수면 온도 데이터(1982년~2011년까지의 평균)는 점선으로 표시하여 올해 수온의 증가세가 심각한 편임을 보여준다. 2. 서울, 부산, 대구, 인천의 미세먼지 (PM10) 시각화 미세먼지 수치...2025.01.25
-
R 프로그래밍을 통한 국내 의료서비스 이용률 분석2025.11.151. R 프로그래밍 데이터 분석 readxl, ggplot2, dplyr, haven, foreign 등의 R 패키지를 활용하여 의료서비스 데이터를 처리하고 시각화했습니다. 지역, 소득, 직업별로 데이터를 그룹화하고 백분율을 계산하여 막대 그래프로 표현했습니다. 이 과정을 통해 데이터 분석 역량을 개발할 수 있었습니다. 2. 지역별 의료서비스 이용률 분석 동과 읍면으로 구분한 지역별 분석 결과, 시골 지역(읍/면)에서 도시(동)보다 의료서비스 이용 횟수가 더 많은 것으로 나타났습니다. 이는 시골 지역의 높은 연령대와 농업, 어업 등...2025.11.15
-
방송통신대학교 통계데이터학과) 데이터시각화 기말과제물 (50점 만점 A+)2025.01.261. 데이터 시각화 사례 뉴스제목: 씨 마른 서울 중저가 아파트…6억원 미만 거래 '역대 최저' 날짜: 2024/05/08 게재된 매체 이름: 아시아타임즈(기업과 경제 코너) 데이터 시각화는 2006년부터 2024년 1분기까지의 서울 금액대별 아파트 거래비중을 나타낸 자료로, 고금리 등의 영향으로 집값이 상승하면서 서울 내 6억원 이하 단지의 거래가 많이 줄어든 반면 '똘똘한 한 채' 선호 현상이 지속되는 가운데 9억원 이상~15억원 미만 아파트 거래가 증가하는 경향을 보여주고 있다. 데이터 시각화 방식은 백분율 누적 막대그래프로...2025.01.26
-
데이터 시각화, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 데이터 시각화의 사례 1970년부터 2022년까지 발생한 학교 총기 사건의 피해자 데이터를 시각화한 사례는 효율적이며 명료하다. 많은 데이터를 하나의 지도에 나타내어 어느 지역에서 어떤 규모의 사고가 났는지를 한눈에 볼 수 있다. 2. 데이터 시각화의 역할 한스 로슬링의 TED 강의에서는 다양한 지표들을 활용한 동적 데이터 시각화를 통해 잘 된 데이터 시각화가 방대하고 복잡한 자료를 한눈에 명료하게 볼 수 있게 하며 데이터를 잘 인지할 수 있게 도와준다는 것을 확인할 수 있었다. 3. 포유동물의 몸무게와 뇌 무게 msleep ...2025.01.25
-
2023년 2학기 파이썬과R 출석수업 중간과제 리포트 30점 만점2025.01.251. 파이썬 파이썬은 현재 가장 널리 사용되는 프로그래밍 언어 중 하나로, 다양한 분야에서 활용되고 있습니다. 파이썬은 간단한 문법과 강력한 기능으로 인해 초보자들도 쉽게 배울 수 있으며, 데이터 분석, 머신러닝, 웹 개발 등 다양한 용도로 사용됩니다. 2. R R은 통계 분석과 데이터 시각화에 특화된 프로그래밍 언어입니다. R은 다양한 통계 패키지와 라이브러리를 제공하여 복잡한 데이터 분석을 쉽게 수행할 수 있습니다. 또한 ggplot2와 같은 강력한 시각화 도구를 통해 데이터를 효과적으로 표현할 수 있습니다. 3. 중간과제 중간...2025.01.25
-
방통대 통계데이터학과 R컴퓨팅 A+2025.01.241. R 프로그래밍 이 프레젠테이션은 R 프로그래밍 언어를 사용하여 다양한 통계 작업을 수행하는 방법을 다룹니다. 주요 내용으로는 벡터 생성, 통계 함수 사용, 결측치 처리, 데이터 추출 및 조작, 성적 등급 부여, 반복문 활용 등이 포함됩니다. 2. 통계 데이터 분석 이 프레젠테이션은 R 프로그래밍을 통해 통계 데이터를 분석하는 방법을 소개합니다. 주요 내용으로는 USArrests 데이터셋을 활용한 데이터 추출 및 통계량 계산, 모의시험 점수 데이터를 이용한 성적 등급 부여 등이 포함됩니다. 3. 반복문 활용 이 프레젠테이션은 f...2025.01.24
-
R을 이용한 베이지안 통계학 입문2025.11.171. 베이지안 통계학 베이지안 통계학은 사전확률(prior probability)과 관측된 데이터를 결합하여 사후확률(posterior probability)을 계산하는 통계적 추론 방법입니다. 이는 전통적인 빈도주의 통계학과 달리 확률을 주관적 신념의 정도로 해석하며, 새로운 정보가 들어올 때마다 확률을 업데이트할 수 있는 유연성을 제공합니다. 2. R 프로그래밍 R은 통계 분석과 데이터 시각화를 위한 오픈소스 프로그래밍 언어입니다. 베이지안 통계 분석을 위해 R에서는 다양한 패키지들(예: rstan, brms, bayesm 등)...2025.11.17
-
30점 만점 방통대 중간과제물, 바이오통계학, 2023-2학기2025.01.261. 모집단, 표본, 모수, 통계량 만 20세 성인 여성 전체는 알고 싶은 대상 전체인 '모집단'에 해당하며, 모집된 100명의 여성의 평균 신장은 표본의 특성을 나타내는 '통계량'에 해당한다. 2. 혈액형 분포 막대그래프 ggplot2 패키지를 사용하여 혈액형의 분포를 나타내는 막대그래프를 그렸다. 3. 평균 신장 계산 mean() 함수를 사용하여 30명 전체의 평균 신장을 계산한 결과는 166.77이다. 4. 중앙값 계산 median() 함수를 사용하여 30명 전체의 신장 중앙값을 계산한 결과는 166이다. 5. 95% 신뢰구간...2025.01.26
