총 77개
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
세종대학교 소프트웨어 특강 과제12025.05.101. Linear Regression 주어진 데이터에 대해 가장 잘 맞는 선형 회귀 모델을 찾았습니다. Gradient Descent 알고리즘을 사용하여 모델의 최적 매개변수를 구했으며, 이를 통해 입력 x=15에 대한 y 값을 예측할 수 있었습니다. 또한 회귀선을 데이터 포인트와 함께 시각화하였습니다. 2. Logistic Regression 두 개의 입력 변수(Petal_Length, Petal_Width)를 사용하여 Iris versicolor와 Iris virginica 두 클래스를 구분하는 로지스틱 회귀 모델을 구현하였습니...2025.05.10
-
Matlab의 PIVlab을 이용한 PIV 분석 실험 보고서2025.04.261. PIV 데이터 분석 PIV 촬영을 통해 얻은 사진을 프로그램을 이용하여 데이터 처리 과정을 알아내고 수행할 수 있었다. PIVlab 프로그램을 사용하여 이미지 불러오기, Masking, PIV 설정, 분석, 보정, 속도장 확인 등의 과정을 거쳤다. 또한 MATLAB에서 데이터 파일을 불러와 그래프 가공을 위한 코딩을 수행하여 속도 분포를 시각화하였다. 2. PIV 실험 결과 및 고찰 PIV 실험 결과를 그래프로 나타내고 필요 없는 부분을 제거하여 관의 모습과 속도 분포를 더 잘 보이도록 하였다. 실험 과정에서 배운 내용을 토대...2025.04.26
-
동국대 경영통계 알렉스 (ALEKS) 자료2025.01.101. Box-and-Whisker 그래프 주어진 17개의 숫자로 box-and-whisker 그래프를 구성하는 방법에 대해 설명합니다. 가장 작은 숫자, 가장 큰 숫자, 중간값(50%), 25% 위치의 숫자, 75% 위치의 숫자를 찾아 그래프를 그립니다. 2. 평균 및 표준편차 계산 주어진 17개의 숫자로 평균과 표준편차를 계산하는 방법을 설명합니다. 평균은 11114666777777777797101010101010101011111212121212127.6666666677.8888888898.22222222283이고, 표준편차는 5...2025.01.10
-
데이터시각화와 인지과학을 활용한 각국 인구구조 변화 조사2025.01.031. 대한민국의 인구 구조 변화 대한민국의 인구는 2000년에 4700만 명을 넘어섰으며, 2020년에는 5000만 명으로 증가했다. 2000년 인구 구조는 연령대가 낮을수록 인구가 많고 고령으로 갈수록 적어지는 양상을 보였다. 그러나 영유아 인구는 다소 낮은 편이었다. 이는 2000년대 초반 저출산 문제가 심각했기 때문이다. 2020년 인구 구조를 보면 고령화가 심각해졌고, 영유아와 젊은 세대 인구가 크게 줄어든 것을 확인할 수 있다. 이는 의학기술 발달로 인한 수명 연장과 저출산 문제가 주요 원인으로 볼 수 있다. 특히 장시간 ...2025.01.03
-
방송통신대학교 통계데이터학과) 데이터시각화 기말과제물 (50점 만점 A+)2025.01.261. 데이터 시각화 사례 뉴스제목: 씨 마른 서울 중저가 아파트…6억원 미만 거래 '역대 최저' 날짜: 2024/05/08 게재된 매체 이름: 아시아타임즈(기업과 경제 코너) 데이터 시각화는 2006년부터 2024년 1분기까지의 서울 금액대별 아파트 거래비중을 나타낸 자료로, 고금리 등의 영향으로 집값이 상승하면서 서울 내 6억원 이하 단지의 거래가 많이 줄어든 반면 '똘똘한 한 채' 선호 현상이 지속되는 가운데 9억원 이상~15억원 미만 아파트 거래가 증가하는 경향을 보여주고 있다. 데이터 시각화 방식은 백분율 누적 막대그래프로...2025.01.26
-
데이터 시각화의 현혹적 표현 사례 분석2025.01.121. 데이터 시각화의 왜곡 데이터 시각화의 왜곡은 정보의 정확한 전달을 방해하며, 때로는 잘못된 해석을 유발할 수 있다. 최근 국내 신문에서 보도된 '한국의 1인당 국민소득이 주요 7개국(G7)과의 격차가 더 벌어졌다'는 기사는 데이터 시각화의 왜곡을 잘 보여주는 사례이다. 이 기사에서 사용된 그래프는 축의 간격이 일정하지 않아 소득 격차를 실제보다 크게 보이게 하였다. 이러한 표현 방식은 데이터의 정확성과 객관성을 훼손할 뿐만 아니라, 독자들에게 과장된 인상을 줄 수 있다. 2. 현혹적 표현의 목적과 영향 현혹적인 표현의 목적은 ...2025.01.12
-
R 언어를 이용한 데이터 크롤링 및 가공2025.04.261. R 언어 R 언어는 통계 및 데이터 분석을 위한 강력한 프로그래밍 언어입니다. R 언어를 이용하여 데이터 크롤링, 전처리, 시각화 등 다양한 작업을 수행할 수 있습니다. R 스튜디오는 R 언어를 사용하기 위한 대표적인 IDE로, 기본적인 통계 및 시각화 기능을 제공하며 다양한 패키지를 통해 복잡한 데이터 분석도 가능합니다. 2. 데이터 크롤링 데이터 크롤링은 웹 상의 데이터를 자동으로 수집하는 기술입니다. R 언어의 twitteR 패키지를 이용하면 트위터 데이터를 크롤링할 수 있습니다. 이를 통해 트위터 데이터를 수집하고 전처...2025.04.26
-
(방송대) 다변량분석, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 다변량분석 이 자료는 R 프로그래밍을 사용하여 다변량 분석을 수행하는 방법을 설명합니다. 다변량 분석은 여러 개의 변수를 동시에 분석하는 통계 기법으로, 변수들 간의 관계를 파악하고 이해하는 데 유용합니다. 이 자료에서는 R에 내장된 'longley' 데이터셋을 사용하여 산점도 행렬, 별그림, 얼굴그림 등의 시각화 기법을 통해 변수 간 상관관계를 분석하고 해석하는 과정을 보여줍니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계의 문제를 이해하고 해결하...2025.01.25
-
시계열 데이터 분석 기법과 A/B 검증, 데이터 시각화를 활용한 기후위기 설득2025.01.261. 시계열 데이터 분석 기법 시계열 데이터에는 추세, 순환, 계절, 불규칙 변동요인이 존재한다. 이를 분석하기 위해 평활화(smoothing), 차분(differencing), 변수변환 등의 기법을 활용할 수 있다. 평활화는 주기가 짧은 변동요인을 제거하여 시계열의 기조적 흐름을 파악하고, 차분은 추세변동을 제거하며, 변수변환은 시계열을 선형화하는 데 도움이 된다. 각 기법의 장단점과 예시를 제시하였다. 2. A/B 검증 추천시스템의 성능 평가를 위해 A/B 검증이 활용된다. 전체 고객을 무작위로 A, B 그룹으로 나누고, A 그...2025.01.26
