
총 13개
-
방통대 통계데이터학과 R컴퓨팅 A+2025.01.241. R 프로그래밍 이 프레젠테이션은 R 프로그래밍 언어를 사용하여 다양한 통계 작업을 수행하는 방법을 다룹니다. 주요 내용으로는 벡터 생성, 통계 함수 사용, 결측치 처리, 데이터 추출 및 조작, 성적 등급 부여, 반복문 활용 등이 포함됩니다. 2. 통계 데이터 분석 이 프레젠테이션은 R 프로그래밍을 통해 통계 데이터를 분석하는 방법을 소개합니다. 주요 내용으로는 USArrests 데이터셋을 활용한 데이터 추출 및 통계량 계산, 모의시험 점수 데이터를 이용한 성적 등급 부여 등이 포함됩니다. 3. 반복문 활용 이 프레젠테이션은 f...2025.01.24
-
출석수업에서 다룬 데이터 분석 과정과 빅데이터 분석에 대한 이해2025.01.241. 데이터 분석 과정 출석수업에서는 R 프로그래밍 언어를 이용하여 'The Billion Prices Project'의 공개 데이터 'Our Public Data'를 분석했습니다. 데이터의 구성을 살펴보고, 국가별 가격 데이터 개수의 히스토그램을 그렸습니다. 또한 온라인과 오프라인 가격 차이를 비교하고, 국가 간 가격 차이의 표준편차를 구해 히스토그램으로 나타냈습니다. 2. 빅데이터 분석의 특징 빅데이터는 volume, variety, velocity, variability, veracity의 5가지 특징을 가집니다. 데이터의 규...2025.01.24
-
데이터 정보처리 입문 이 교수님은 원래 만점 안주심 그래서 29점짜리 과제임 하지만 완벽함2025.01.251. 전국 총출생성비 추이 1994년도부터 1997년즈음까지 특히 수직하락하는 모습을 보인다. 1999년즈음부터 조금 높아졌고 전체적으로는 계속 낮아지는 경향을 보인다. 90년대초반까지는 출생성비가 116을 넘기도 했으나, 현대에 들어 점차 남아 선호사상이 위측되는 등의 이유로 남아 출산의 비율이 꾸준히 떨어지고 있으며, 2020년에는 10.8까지 낮아졌다. 2. 서울과 경상북도의 총출생성비 비교 서울과 경북의 총 출생성비는 2007년 기점부터는 크게 차이가 없다. 그 전에는 대도시인 서울보다 경상북도의 출생성비가 더 높은 모습을 ...2025.01.25
-
방송통신대학교 통계데이터학과)바이오통계학 중간과제물 (30점 만점 A+)2025.01.261. 모집단, 표본, 모수, 통계량 모집단은 우리가 알고 싶은 대상 전체를 의미하며, 표본은 모집단의 일부를 실제로 관측한 것을 말한다. 모수는 모집단 전체의 특성을 나타내는 값이고, 통계량은 표본의 특성을 나타내는 값이다. 이 문제에서 모집된 만 7세 아동 100명은 표본에 해당한다. 2. 히스토그램 그리기 R 프로그래밍을 이용하여 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그렸다. 이를 통해 데이터의 분포 특성을 시각적으로 확인할 수 있다. 3. 중앙값 구하기 R 프로그래밍을 이용하여 이 데이터에 포함된 156명 전체의...2025.01.26
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
방송통신대학교 통계데이터학과) R컴퓨팅 출석과제물 (30점 만점 A+)2025.01.261. R 프로그래밍 제출된 자료에는 R 프로그래밍을 활용한 다양한 작업이 포함되어 있습니다. 이를 통해 R 언어의 기본 문법과 통계 함수 사용법, 데이터 처리 및 분석 기법 등을 익힐 수 있습니다. 특히 학번을 이용한 벡터 생성, 결측치 처리, airquality 데이터셋 활용 등의 내용이 포함되어 있습니다. 2. 통계 데이터 분석 제출된 자료에는 통계 데이터 분석과 관련된 내용이 포함되어 있습니다. 벡터 데이터의 평균, 분산, 중앙값 계산, airquality 데이터셋의 결측치 확인 및 분석 등을 통해 통계 데이터 처리 및 분석 ...2025.01.26
-
1990년부터 2022년까지의 연도별 전국 총출생성비 시계열 분석2025.01.251. 총출생성비 시계열 분석 1990년부터 2022년까지의 전국 총출생성비 데이터를 시계열도표로 나타내고 경향을 설명하였습니다. 데이터 분석을 위해 R 프로그래밍 언어를 사용하여 줄기-잎 그림, 히스토그램, 상자그림 등의 시각화 기법을 적용하였습니다. 이를 통해 데이터의 분포와 특성을 파악할 수 있었습니다. 1. 총출생성비 시계열 분석 총출생성비는 한 여성이 가임기 동안 낳을 것으로 예상되는 평균 출생아 수를 나타내는 지표입니다. 이 지표는 인구 변화와 관련된 중요한 정보를 제공합니다. 시계열 분석을 통해 총출생성비의 추이와 변화 ...2025.01.25
-
방통대 [데이터시각화] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 워드 클라우드 워드 클라우드는 텍스트 데이터에서 단어의 빈도 수가 높을수록 큰 글씨로 표현하는 시각화 기법이다. 주제나 핵심 키워드를 쉽고 효과적으로 전달할 수 있다는 장점이 있다. SNS 데이터에서 인기 키워드를 찾거나 연설문에서 핵심 내용과 주제를 찾는데 유용하게 사용될 수 있다. 또한 온라인 게시글에서 여론을 찾아내기도 하며 고객 리뷰에 대한 요약을 제공하기도 한다. 특히나 미국 대선 때 사용되는 워드 클라우드에서는 각 후보자의 핵심 공약이나 정책 방향, 이슈, 유권자들이 중요하게 생각하는 가치관을 직관적으로 확인할 수 ...2025.01.25
-
30점 만점 방통대 R컴퓨팅 2023-1학기2025.01.261. 데이터 생성 및 활용 오늘날 데이터의 중요성이 매우 높아졌으며, 이를 활용하여 의사결정에 활용하는 것이 중요하다. 하지만 데이터 활용 수준에 따른 격차로 인해 사회적 불평등이 발생할 수 있다. 따라서 데이터의 의미를 찾고 해석하기 위해 통계 프로그램인 R이 사용되고 있다. 2. R 프로그래밍 언어 R은 오픈소스 프로그램으로 무료로 사용할 수 있어 접근성이 높다. 또한 커뮤니티가 활성화되어 있어 코드 및 분석 정보를 공유할 수 있으며, 시각화 능력이 뛰어나다는 장점이 있다. 다만 초보자의 경우 함수와 패키지가 다양하여 프로그램 ...2025.01.26
-
2023년 1학기 방통대 R컴퓨팅 출석수업 중간과2025.01.251. R 프로그래밍 R은 약 20년 전 어문계 사범대학을 졸업하고 이후 제약회사의 국내외 업무를 하다가 금년도 이렇게 방송통신대학교 통계-데이터과학과에 편입하고서야 처음 접하게 되는 프로그래밍 언어입니다. 이전까지는 R의 R자도 들어보지 못하였고, 첫학기(한학기)의 중반이 넘어가고 있는 지금에도 아직 생경한 것이 사실입니다. 다행인 것은 이 R컴퓨팅 과목뿐만 아니라 함께 수강하고 있는 몇 과목들, 예를 들어 통계학개론이나 정보처리입문과 같은 과목에서 R에 대해 부분적으로 반복적으로 배울 수 있어 학습-습득에 도움이 되고 있습니다. ...2025.01.25