총 75개
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
방송통신대학교 통계데이터학과) 파이썬과 R 출석수업과제물 (30점 만점 A+)2025.01.261. R 데이터프레임 생성 R을 사용하여 name, height, weight 3개의 열을 갖는 데이터프레임을 생성하고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 2. 파이썬 딕셔너리 생성 x1, x2, x3 리스트를 사용하여 name, height, weight 키를 가진 파이썬 딕셔너리를 생성하였습니다. 3. 파이썬 데이터프레임 생성 파이썬에서 생성한 딕셔너리를 사용하여 데이터프레임을 만들고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 4. 파이썬 함수...2025.01.26
-
정보화 사회를 대비한 자료 표현 교육: 초등학생을 위한 수업 방안2025.01.161. 자료 수집 및 정리 학생들이 자료를 수집하고 도수분포표로 정리하는 방법을 배웁니다. 이를 통해 자료의 특성을 이해하고 시각적으로 표현하는 능력을 기릅니다. 2. 그래프 작성 막대그래프와 원형그래프를 작성하는 방법을 익힙니다. 각 그래프의 특성을 이해하고 자료를 효과적으로 표현하는 방법을 배웁니다. 3. 그래프 해석 및 발표 작성한 그래프를 발표하고 서로 비교하며 차이점을 설명합니다. 이를 통해 다양한 시각적 표현 방법의 장단점을 이해할 수 있습니다. 4. 디지털 도구 활용 엑셀이나 스프레드시트 등의 디지털 도구를 활용하여 그래...2025.01.16
-
데이터 마이닝의 정의와 활용 사례2025.01.021. 데이터 마이닝의 이해 데이터 마이닝은 대량의 데이터 세트에서 가치 있는 정보와 통찰력을 추출하는 프로세스입니다. 여기에는 통계 분석, 기계 학습, 패턴 인식 등의 기술을 사용하여 데이터 내 숨겨진 패턴, 상관 관계 및 트렌드를 식별하는 것이 포함됩니다. 데이터 마이닝 프로세스에는 데이터 수집, 정리 및 전처리, 탐색, 모델 구축, 평가, 배치 등의 단계가 포함됩니다. 2. 데이터 마이닝의 응용 데이터 마이닝의 주요 애플리케이션 중 하나는 예측 분석입니다. 이를 통해 기업은 고객 수요를 예측하고 재고를 효율적으로 관리할 수 있습...2025.01.02
-
세종대학교 소프트웨어 특강 과제12025.05.101. Linear Regression 주어진 데이터에 대해 가장 잘 맞는 선형 회귀 모델을 찾았습니다. Gradient Descent 알고리즘을 사용하여 모델의 최적 매개변수를 구했으며, 이를 통해 입력 x=15에 대한 y 값을 예측할 수 있었습니다. 또한 회귀선을 데이터 포인트와 함께 시각화하였습니다. 2. Logistic Regression 두 개의 입력 변수(Petal_Length, Petal_Width)를 사용하여 Iris versicolor와 Iris virginica 두 클래스를 구분하는 로지스틱 회귀 모델을 구현하였습니...2025.05.10
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
빅데이터의 기술 요건 네 단계에 대해 설명하세요2025.01.181. 데이터 수집 이 단계는 기업 내부와 외부에서 발생하는 엄청난 양의 데이터를 모으는 과정을 말한다. 이 과정에서는 다양한 데이터 소스로부터 필요한 정보를 수동이나 자동으로 수집하는 기술이 필요하다. 예를 들어, 기업 내부 데이터는 ETL(Extraction, Transformation, Load) 솔루션을 통해 추출, 변환, 적재하는 방식으로 확보할 수 있으며, EII(Enterprise Information Integration)를 활용하여 데이터를 통합하고 분석할 수 있다. 외부 데이터의 경우, 웹 크롤링 엔진을 사용하여 인...2025.01.18
-
Matlab의 PIVlab을 이용한 PIV 분석 실험 보고서2025.04.261. PIV 데이터 분석 PIV 촬영을 통해 얻은 사진을 프로그램을 이용하여 데이터 처리 과정을 알아내고 수행할 수 있었다. PIVlab 프로그램을 사용하여 이미지 불러오기, Masking, PIV 설정, 분석, 보정, 속도장 확인 등의 과정을 거쳤다. 또한 MATLAB에서 데이터 파일을 불러와 그래프 가공을 위한 코딩을 수행하여 속도 분포를 시각화하였다. 2. PIV 실험 결과 및 고찰 PIV 실험 결과를 그래프로 나타내고 필요 없는 부분을 제거하여 관의 모습과 속도 분포를 더 잘 보이도록 하였다. 실험 과정에서 배운 내용을 토대...2025.04.26
-
통계학자로서의 나이팅게일에 대해서2025.04.271. 나이팅게일의 통계 활용 나이팅게일은 크림전쟁 당시 군 간호사로 근무하면서 전쟁터에서 사망하는 군인보다 병원에서 위생 문제로 인한 전염병이나 적절한 치료를 받지 못해 사망하는 군인이 더 많다는 것을 발견했습니다. 이를 개선하고자 그녀는 병원에서 일어나는 모든 일들을 기록하고 통계를 작성하여 병원의 상황을 정확히 파악하고자 했습니다. 이를 통해 질병의 주 원인이 병원의 위생 상태 때문이라는 점을 발견하고, 화장실과 오수구덩이 청소, 병동 환기구 설치 등 병실 주변 환경에 대한 대대적인 개선 작업을 진행했습니다. 그 결과 환자의 사...2025.04.27
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
