총 76개
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
세종대학교 소프트웨어 특강 과제12025.05.101. Linear Regression 주어진 데이터에 대해 가장 잘 맞는 선형 회귀 모델을 찾았습니다. Gradient Descent 알고리즘을 사용하여 모델의 최적 매개변수를 구했으며, 이를 통해 입력 x=15에 대한 y 값을 예측할 수 있었습니다. 또한 회귀선을 데이터 포인트와 함께 시각화하였습니다. 2. Logistic Regression 두 개의 입력 변수(Petal_Length, Petal_Width)를 사용하여 Iris versicolor와 Iris virginica 두 클래스를 구분하는 로지스틱 회귀 모델을 구현하였습니...2025.05.10
-
Matlab의 PIVlab을 이용한 PIV 분석 실험 보고서2025.04.261. PIV 데이터 분석 PIV 촬영을 통해 얻은 사진을 프로그램을 이용하여 데이터 처리 과정을 알아내고 수행할 수 있었다. PIVlab 프로그램을 사용하여 이미지 불러오기, Masking, PIV 설정, 분석, 보정, 속도장 확인 등의 과정을 거쳤다. 또한 MATLAB에서 데이터 파일을 불러와 그래프 가공을 위한 코딩을 수행하여 속도 분포를 시각화하였다. 2. PIV 실험 결과 및 고찰 PIV 실험 결과를 그래프로 나타내고 필요 없는 부분을 제거하여 관의 모습과 속도 분포를 더 잘 보이도록 하였다. 실험 과정에서 배운 내용을 토대...2025.04.26
-
전산개론_빅데이터의 정의와 특징 그리고 분석기술을 조사하여 제출하시오.2025.05.021. 4차 산업혁명 4차 산업혁명의 특징은 초연결성, 융합, 초지능, 노동력 위기, 심각한 불균형과 양극화 현상 등 5가지로 분류할 수 있다. 이러한 4차 산업혁명의 배경 속에서 빅데이터의 개념, 특징, 분석기술이 등장하게 되었다. 2. 빅데이터의 개념 빅데이터는 많은 양의 데이터로, 속도가 빠르고 다양한 종류의 데이터를 포함하고 있다. 기존의 관리 방법이나 분석 체계로는 처리하기 어려운 방대한 양의 데이터 집합을 저장, 수집, 분석, 관리, 시각화하는 정보통신 기술 분야라고 볼 수 있다. 3. 빅데이터의 특징 빅데이터의 대표적인 ...2025.05.02
-
탐색적 자료분석2025.05.061. 데이터 분석 데이터 분석은 대상인 데이터를 어떻게 이해하는가에 따라 모델링 전략이 결정되며, 모델링의 성능도 결정된다. 특히 탐색형 자료분석은 데이터 분석의 시작으로 데이터의 주요 특성을 파악하기 위해 반드시 수행해야 하는 작업이다. 이 과정에서는 기초 통계 분석 및 그래프 분석을 통한 분석작업을 수행한다. 2. 데이터 유형 데이터는 크게 수치형 데이터와 범주형 데이터로 구분할 수 있다. 수치형 데이터는 연속형 데이터와 이산형 데이터로, 범주형 데이터는 순서형 데이터와 명목형 데이터로 나뉜다. 각 데이터 유형에 따라 적절한 분...2025.05.06
-
동국대 경영통계 알렉스 (ALEKS) 자료2025.01.101. Box-and-Whisker 그래프 주어진 17개의 숫자로 box-and-whisker 그래프를 구성하는 방법에 대해 설명합니다. 가장 작은 숫자, 가장 큰 숫자, 중간값(50%), 25% 위치의 숫자, 75% 위치의 숫자를 찾아 그래프를 그립니다. 2. 평균 및 표준편차 계산 주어진 17개의 숫자로 평균과 표준편차를 계산하는 방법을 설명합니다. 평균은 11114666777777777797101010101010101011111212121212127.6666666677.8888888898.22222222283이고, 표준편차는 5...2025.01.10
-
데이터시각화와 인지과학을 활용한 각국 인구구조 변화 조사2025.01.031. 대한민국의 인구 구조 변화 대한민국의 인구는 2000년에 4700만 명을 넘어섰으며, 2020년에는 5000만 명으로 증가했다. 2000년 인구 구조는 연령대가 낮을수록 인구가 많고 고령으로 갈수록 적어지는 양상을 보였다. 그러나 영유아 인구는 다소 낮은 편이었다. 이는 2000년대 초반 저출산 문제가 심각했기 때문이다. 2020년 인구 구조를 보면 고령화가 심각해졌고, 영유아와 젊은 세대 인구가 크게 줄어든 것을 확인할 수 있다. 이는 의학기술 발달로 인한 수명 연장과 저출산 문제가 주요 원인으로 볼 수 있다. 특히 장시간 ...2025.01.03
-
방송통신대학교 통계데이터학과) 데이터시각화 기말과제물 (50점 만점 A+)2025.01.261. 데이터 시각화 사례 뉴스제목: 씨 마른 서울 중저가 아파트…6억원 미만 거래 '역대 최저' 날짜: 2024/05/08 게재된 매체 이름: 아시아타임즈(기업과 경제 코너) 데이터 시각화는 2006년부터 2024년 1분기까지의 서울 금액대별 아파트 거래비중을 나타낸 자료로, 고금리 등의 영향으로 집값이 상승하면서 서울 내 6억원 이하 단지의 거래가 많이 줄어든 반면 '똘똘한 한 채' 선호 현상이 지속되는 가운데 9억원 이상~15억원 미만 아파트 거래가 증가하는 경향을 보여주고 있다. 데이터 시각화 방식은 백분율 누적 막대그래프로...2025.01.26
-
데이터 시각화의 현혹적 표현 사례 분석2025.01.121. 데이터 시각화의 왜곡 데이터 시각화의 왜곡은 정보의 정확한 전달을 방해하며, 때로는 잘못된 해석을 유발할 수 있다. 최근 국내 신문에서 보도된 '한국의 1인당 국민소득이 주요 7개국(G7)과의 격차가 더 벌어졌다'는 기사는 데이터 시각화의 왜곡을 잘 보여주는 사례이다. 이 기사에서 사용된 그래프는 축의 간격이 일정하지 않아 소득 격차를 실제보다 크게 보이게 하였다. 이러한 표현 방식은 데이터의 정확성과 객관성을 훼손할 뿐만 아니라, 독자들에게 과장된 인상을 줄 수 있다. 2. 현혹적 표현의 목적과 영향 현혹적인 표현의 목적은 ...2025.01.12
-
R 언어를 이용한 데이터 크롤링 및 가공2025.04.261. R 언어 R 언어는 통계 및 데이터 분석을 위한 강력한 프로그래밍 언어입니다. R 언어를 이용하여 데이터 크롤링, 전처리, 시각화 등 다양한 작업을 수행할 수 있습니다. R 스튜디오는 R 언어를 사용하기 위한 대표적인 IDE로, 기본적인 통계 및 시각화 기능을 제공하며 다양한 패키지를 통해 복잡한 데이터 분석도 가능합니다. 2. 데이터 크롤링 데이터 크롤링은 웹 상의 데이터를 자동으로 수집하는 기술입니다. R 언어의 twitteR 패키지를 이용하면 트위터 데이터를 크롤링할 수 있습니다. 이를 통해 트위터 데이터를 수집하고 전처...2025.04.26
