
총 454개
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
R 언어를 이용한 데이터 크롤링 및 가공2025.04.261. R 언어 R 언어는 통계 및 데이터 분석을 위한 강력한 프로그래밍 언어입니다. R 언어를 이용하여 데이터 크롤링, 전처리, 시각화 등 다양한 작업을 수행할 수 있습니다. R 스튜디오는 R 언어를 사용하기 위한 대표적인 IDE로, 기본적인 통계 및 시각화 기능을 제공하며 다양한 패키지를 통해 복잡한 데이터 분석도 가능합니다. 2. 데이터 크롤링 데이터 크롤링은 웹 상의 데이터를 자동으로 수집하는 기술입니다. R 언어의 twitteR 패키지를 이용하면 트위터 데이터를 크롤링할 수 있습니다. 이를 통해 트위터 데이터를 수집하고 전처...2025.04.26
-
방통대 통계데이터과학과 R데이터분석 A+2025.01.241. 성과점수 분석 1. 연구 종료 시점에서의 성과점수(t2)의 상자그림을 성별로 나란히 그렸습니다. 그래프의 제목으로 본인의 학번을 넣었습니다. 2. 성별에 따라 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 성별에 따른 성과점수의 평균에 차이가 있는 것으로 나타났습니다(p-value = 0.04677<0.05). 3. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균을 구했습니다. 4. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 스트레...2025.01.24
-
2023년 2학기 파이썬과R 출석수업 중간과제 리포트 30점 만점2025.01.251. 파이썬 파이썬은 현재 가장 널리 사용되는 프로그래밍 언어 중 하나로, 다양한 분야에서 활용되고 있습니다. 파이썬은 간단한 문법과 강력한 기능으로 인해 초보자들도 쉽게 배울 수 있으며, 데이터 분석, 머신러닝, 웹 개발 등 다양한 용도로 사용됩니다. 2. R R은 통계 분석과 데이터 시각화에 특화된 프로그래밍 언어입니다. R은 다양한 통계 패키지와 라이브러리를 제공하여 복잡한 데이터 분석을 쉽게 수행할 수 있습니다. 또한 ggplot2와 같은 강력한 시각화 도구를 통해 데이터를 효과적으로 표현할 수 있습니다. 3. 중간과제 중간...2025.01.25
-
방송통신대학교 통계데이터학과) R컴퓨팅 출석과제물 (30점 만점 A+)2025.01.261. R 프로그래밍 제출된 자료에는 R 프로그래밍을 활용한 다양한 작업이 포함되어 있습니다. 이를 통해 R 언어의 기본 문법과 통계 함수 사용법, 데이터 처리 및 분석 기법 등을 익힐 수 있습니다. 특히 학번을 이용한 벡터 생성, 결측치 처리, airquality 데이터셋 활용 등의 내용이 포함되어 있습니다. 2. 통계 데이터 분석 제출된 자료에는 통계 데이터 분석과 관련된 내용이 포함되어 있습니다. 벡터 데이터의 평균, 분산, 중앙값 계산, airquality 데이터셋의 결측치 확인 및 분석 등을 통해 통계 데이터 처리 및 분석 ...2025.01.26
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
30점 만점 방통대 파이썬과R 2023-2학기2025.01.261. R 데이터 프레임 생성 및 데이터 추출 R을 사용하여 주어진 자료로 3개의 열을 갖는 데이터 프레임을 생성하고, 첫 번째 사람의 키와 몸무게 값을 추출하는 방법을 설명하였습니다. 또한 Python에서도 동일한 작업을 수행하는 방법을 제시하였습니다. 2. Python 및 R에서의 딕셔너리 생성 Python과 R에서 주어진 자료를 이용하여 딕셔너리를 생성하는 방법을 설명하였습니다. Python에서는 딕셔너리 생성 후 keys(), values(), items() 함수를 사용하여 결과를 확인하였고, R에서는 list 함수를 사용하여...2025.01.26
-
출석수업에서 다룬 데이터 분석 과정과 빅데이터 분석에 대한 이해2025.01.241. 데이터 분석 과정 출석수업에서는 R 프로그래밍 언어를 이용하여 'The Billion Prices Project'의 공개 데이터 'Our Public Data'를 분석했습니다. 데이터의 구성을 살펴보고, 국가별 가격 데이터 개수의 히스토그램을 그렸습니다. 또한 온라인과 오프라인 가격 차이를 비교하고, 국가 간 가격 차이의 표준편차를 구해 히스토그램으로 나타냈습니다. 2. 빅데이터 분석의 특징 빅데이터는 volume, variety, velocity, variability, veracity의 5가지 특징을 가집니다. 데이터의 규...2025.01.24
-
2023년 1학기 방통대 R컴퓨팅 출석수업 중간과2025.01.251. R 프로그래밍 R은 약 20년 전 어문계 사범대학을 졸업하고 이후 제약회사의 국내외 업무를 하다가 금년도 이렇게 방송통신대학교 통계-데이터과학과에 편입하고서야 처음 접하게 되는 프로그래밍 언어입니다. 이전까지는 R의 R자도 들어보지 못하였고, 첫학기(한학기)의 중반이 넘어가고 있는 지금에도 아직 생경한 것이 사실입니다. 다행인 것은 이 R컴퓨팅 과목뿐만 아니라 함께 수강하고 있는 몇 과목들, 예를 들어 통계학개론이나 정보처리입문과 같은 과목에서 R에 대해 부분적으로 반복적으로 배울 수 있어 학습-습득에 도움이 되고 있습니다. ...2025.01.25
-
R언어 기본 용어 정리 과제2025.04.261. 스칼라(scalar) 스칼라는 단순히 객체에 하나의 값을 할당했을 때, 바로 그 할당되는 값을 지칭합니다. 스칼라값에는 실수, 문자열, 논리값(TRUE, FALSE)이라는 3가지 자료형이 있으며, 벡터와는 달리 하나의 값만을 지정해준다는 특징이 있습니다. 2. 벡터(vector) 벡터는 같은 자료형을 가진 스칼라값들을 순서를 가지고 일렬로 나열한 자료구조입니다. R에서는 c() 함수를 이용하여 여러 개의 데이터를 입력할 수 있으며, 벡터의 각 요소를 반복해서 추출하고 싶을 때는 times와 each를 사용할 수 있습니다. 3....2025.04.26