총 77개
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
세종대학교 소프트웨어 특강 과제12025.05.101. Linear Regression 주어진 데이터에 대해 가장 잘 맞는 선형 회귀 모델을 찾았습니다. Gradient Descent 알고리즘을 사용하여 모델의 최적 매개변수를 구했으며, 이를 통해 입력 x=15에 대한 y 값을 예측할 수 있었습니다. 또한 회귀선을 데이터 포인트와 함께 시각화하였습니다. 2. Logistic Regression 두 개의 입력 변수(Petal_Length, Petal_Width)를 사용하여 Iris versicolor와 Iris virginica 두 클래스를 구분하는 로지스틱 회귀 모델을 구현하였습니...2025.05.10
-
Matlab의 PIVlab을 이용한 PIV 분석 실험 보고서2025.04.261. PIV 데이터 분석 PIV 촬영을 통해 얻은 사진을 프로그램을 이용하여 데이터 처리 과정을 알아내고 수행할 수 있었다. PIVlab 프로그램을 사용하여 이미지 불러오기, Masking, PIV 설정, 분석, 보정, 속도장 확인 등의 과정을 거쳤다. 또한 MATLAB에서 데이터 파일을 불러와 그래프 가공을 위한 코딩을 수행하여 속도 분포를 시각화하였다. 2. PIV 실험 결과 및 고찰 PIV 실험 결과를 그래프로 나타내고 필요 없는 부분을 제거하여 관의 모습과 속도 분포를 더 잘 보이도록 하였다. 실험 과정에서 배운 내용을 토대...2025.04.26
-
동국대 경영통계 알렉스 (ALEKS) 자료2025.01.101. Box-and-Whisker 그래프 주어진 17개의 숫자로 box-and-whisker 그래프를 구성하는 방법에 대해 설명합니다. 가장 작은 숫자, 가장 큰 숫자, 중간값(50%), 25% 위치의 숫자, 75% 위치의 숫자를 찾아 그래프를 그립니다. 2. 평균 및 표준편차 계산 주어진 17개의 숫자로 평균과 표준편차를 계산하는 방법을 설명합니다. 평균은 11114666777777777797101010101010101011111212121212127.6666666677.8888888898.22222222283이고, 표준편차는 5...2025.01.10
-
방송통신대학교 통계데이터학과) 데이터시각화 기말과제물 (50점 만점 A+)2025.01.261. 데이터 시각화 사례 뉴스제목: 씨 마른 서울 중저가 아파트…6억원 미만 거래 '역대 최저' 날짜: 2024/05/08 게재된 매체 이름: 아시아타임즈(기업과 경제 코너) 데이터 시각화는 2006년부터 2024년 1분기까지의 서울 금액대별 아파트 거래비중을 나타낸 자료로, 고금리 등의 영향으로 집값이 상승하면서 서울 내 6억원 이하 단지의 거래가 많이 줄어든 반면 '똘똘한 한 채' 선호 현상이 지속되는 가운데 9억원 이상~15억원 미만 아파트 거래가 증가하는 경향을 보여주고 있다. 데이터 시각화 방식은 백분율 누적 막대그래프로...2025.01.26
-
지리정보를 활용한 외장재료 선정활용방안_지리정보시스템 과제_A++2025.01.211. BIM(Building Information Modeling) BIM 모델링을 통해 파사드 외장재료의 종류와 색상, 크기 등을 미리 시뮬레이션해 볼 수 있습니다. 이를 통해 실제 시공 전에 예상 모습을 파악하고 수정사항을 발견할 수 있습니다. BIM은 건축분야 중심으로 활용 중이며, 건설 프로세스 전반에 적용되기 보다는 설계 과정에 국한되어 부분적으로 적용되고 있는 실정입니다. 2. GIS(지리정보시스템) 지리정보시스템(GIS)을 이용하여 지역의 기후나 풍토 등을 고려한 외장재료를 선정할 수 있습니다. 예를 들어, 해안지역에서...2025.01.21
-
(방송대) 다변량분석, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 다변량분석 이 자료는 R 프로그래밍을 사용하여 다변량 분석을 수행하는 방법을 설명합니다. 다변량 분석은 여러 개의 변수를 동시에 분석하는 통계 기법으로, 변수들 간의 관계를 파악하고 이해하는 데 유용합니다. 이 자료에서는 R에 내장된 'longley' 데이터셋을 사용하여 산점도 행렬, 별그림, 얼굴그림 등의 시각화 기법을 통해 변수 간 상관관계를 분석하고 해석하는 과정을 보여줍니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계의 문제를 이해하고 해결하...2025.01.25
-
태블로를 이용한 데이터 시각화 사례분석2025.01.191. 태블로(Tableau)의 소개 태블로(Tableau)는 사용자가 데이터를 시각적으로 분석하고 이해할 수 있도록 도와주는 비즈니스 인텔리전스(BI; Business Intelligence) 도구이다. 태블로는 비즈니스 인텔리전스 도구이자 데이터 시각화 도구로, 누구나 쉽게 배워서 사용할 수 있으며 많은 사람들이 사용하고 있어 참고 자료를 쉽게 찾아볼 수 있다. 2. 태블로(Tableau) 차트 종류 태블로에서 제공하는 다양한 차트 종류에는 막대 그래프, 라인 차트, 파이 차트, 분산형 차트, 박스 플롯, 히스토그램, 하이라이트 ...2025.01.19
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
데이터시각화와 인지과학을 활용한 각국 인구구조 변화 조사2025.01.031. 대한민국의 인구 구조 변화 대한민국의 인구는 2000년에 4700만 명을 넘어섰으며, 2020년에는 5000만 명으로 증가했다. 2000년 인구 구조는 연령대가 낮을수록 인구가 많고 고령으로 갈수록 적어지는 양상을 보였다. 그러나 영유아 인구는 다소 낮은 편이었다. 이는 2000년대 초반 저출산 문제가 심각했기 때문이다. 2020년 인구 구조를 보면 고령화가 심각해졌고, 영유아와 젊은 세대 인구가 크게 줄어든 것을 확인할 수 있다. 이는 의학기술 발달로 인한 수명 연장과 저출산 문제가 주요 원인으로 볼 수 있다. 특히 장시간 ...2025.01.03
