총 89개
-
정규분포를 이용한 야구선수 연봉과 WAR 수치 분석2025.11.111. 정규분포와 데이터 분석 본 연구에서는 2018년 500타석 이상을 충족한 주전급 야구선수 40명의 2019시즌 연봉과 2018시즌 WAR 수치를 수집하여 정규분포 그래프로 분석했다. 연봉은 백만원 단위로, WAR은 100을 곱하여 표준화했다. 평균과 표준편차를 계산한 결과 연봉은 평균 694.6, 표준편차 570.3이고, WAR*100은 평균 354.3, 표준편차 156.1로 나타났다. 엑셀의 NORM.DIST 함수를 이용해 히스토그램 위에 정규분포 곡선을 그려 데이터의 분포 패턴을 시각화했다. 2. 야구선수 연봉의 편포 현상...2025.11.11
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
디자이너 관점의 코퍼스 활용과 산업디자인 전망2025.11.121. 정보디자인과 코퍼스 활용 정보디자인은 데이터를 분석하고 정리하여 유용한 정보로 변환하는 디자인 분야입니다. 4차 산업혁명 시대에 데이터의 중요성이 높아지면서, 코퍼스 자료를 네트워크로 표현하는 방식이 주목받고 있습니다. 링크의 관련성을 시각적으로 표현하되, 링크의 굵기, 진하기, 길이로 정보의 강도를 표시함으로써 복잡한 데이터를 직관적으로 이해할 수 있게 합니다. 2. UX디자인과 코퍼스 기반 소비자 분석 UX디자인은 사용자 경험을 중심으로 하는 디자인으로, 소비자의 니즈를 파악하는 것이 중요합니다. 코퍼스를 통해 단어의 빈도...2025.11.12
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
데이터시각화와 인지과학을 활용한 각국 인구구조 변화 조사2025.01.031. 대한민국의 인구 구조 변화 대한민국의 인구는 2000년에 4700만 명을 넘어섰으며, 2020년에는 5000만 명으로 증가했다. 2000년 인구 구조는 연령대가 낮을수록 인구가 많고 고령으로 갈수록 적어지는 양상을 보였다. 그러나 영유아 인구는 다소 낮은 편이었다. 이는 2000년대 초반 저출산 문제가 심각했기 때문이다. 2020년 인구 구조를 보면 고령화가 심각해졌고, 영유아와 젊은 세대 인구가 크게 줄어든 것을 확인할 수 있다. 이는 의학기술 발달로 인한 수명 연장과 저출산 문제가 주요 원인으로 볼 수 있다. 특히 장시간 ...2025.01.03
-
[계측공학 및 실습]GPS를 이용한 위치 및 속도 측정_결과보고서2025.04.301. GPS 추적 U-center를 이용한 GPS 추적을 통해 GPS 경로를 확인하였고, Google Earth를 이용하여 정문 앞 정지, 이동 1~5, 본관 앞 정지 등의 위치 정보를 확인하였다. 위도와 경도 값을 이용하여 두 지점 간의 직선거리를 계산한 결과, 약 180.9m로 나타났다. 2. MATLAB을 이용한 GPS 추적 MATLAB을 이용하여 GPS 추적 그래프를 그리려 했으나, 그림과 그래프가 겹치거나 좌표축이 맞지 않는 등의 문제가 발생하였다. 이를 해결하기 위해 그림을 Figure 창에 올리는 다양한 방법을 시도하였...2025.04.30
-
방송통신대학교 통계데이터학과) 데이터시각화 기말과제물 (50점 만점 A+)2025.01.261. 데이터 시각화 사례 뉴스제목: 씨 마른 서울 중저가 아파트…6억원 미만 거래 '역대 최저' 날짜: 2024/05/08 게재된 매체 이름: 아시아타임즈(기업과 경제 코너) 데이터 시각화는 2006년부터 2024년 1분기까지의 서울 금액대별 아파트 거래비중을 나타낸 자료로, 고금리 등의 영향으로 집값이 상승하면서 서울 내 6억원 이하 단지의 거래가 많이 줄어든 반면 '똘똘한 한 채' 선호 현상이 지속되는 가운데 9억원 이상~15억원 미만 아파트 거래가 증가하는 경향을 보여주고 있다. 데이터 시각화 방식은 백분율 누적 막대그래프로...2025.01.26
-
디지털 시대의 예술 표현 경향 및 특성 / NFT 예술의 구체적 사례 및 전망2025.05.081. 디지털 시대의 예술 표현 경향 및 특성 디지털 시대의 예술 표현은 기술의 발전과 디지털화의 영향을 받아 혁신적인 변화를 겪고 있다. 다양한 디지털 도구와 플랫폼이 예술가들에게 창작과 공유의 새로운 방식을 제공하고, 예술 작품의 형태와 경험을 혁신시켜오고 있다. 이에 따라 디지털 시대의 예술 표현은 상호작용과 참여, 다중 매체와 융합, 데이터 활용, 공간의 제약 해소 등의 특징을 보이고 있다. 2. NFT 예술의 구체적 사례 및 전망 NFT(Non Fungible Token)는 디지털 대상에 원본임을 증명하는 토큰을 붙여 대체불...2025.05.08
-
'심슨의 역설'은 무엇인지 그 발생원인을 포함하여 구체적으로 기술하고, 우리 주위에서 발생한 사례를 찾아 요약 정리하되, 그 역설을 해결하여 올바로 해석하시오.2025.05.101. 심슨의 역설 심슨의 역설은 데이터 분석에서 중요한 개념으로, 전체적인 패턴과 그룹 내부의 패턴이 상반되는 현상을 의미합니다. 이 현상은 데이터를 해석하거나 결론을 도출할 때 오해를 초래할 수 있으며 잘못된 결정이나 판단으로 이어질 수 있습니다. 심슨의 역설은 데이터의 부분적인 관찰 결과가 전체적인 관찰 결과와는 다른 경향을 보일 때 발생하며, 데이터의 구성이나 변수 사이의 상호작용에 의해 발생할 수 있습니다. 이를 해결하기 위해서는 데이터를 세분화하여 그룹별로 분석하고, 교차분석을 통한 종합적인 판단, 데이터 시각화 등의 방안...2025.05.10
-
방송통신대_빅데이터의이해와활용_중간과제(24년도 2학기, 만점)2025.01.261. 시계열 데이터 분석 기법 시계열 데이터를 분석하기 위한 기법으로 이동평균 모델, 지수평활법, 자기회귀이동평균 모델(ARMA)을 선택하여 각각의 장단점을 설명하였습니다. 이동평균 모델은 데이터의 변동을 부드럽게 만들어 전체적인 추세를 파악할 수 있지만 미래 예측에 한계가 있습니다. 지수평활법은 최신 데이터에 더 큰 가중치를 주어 노이즈를 제거하고 예측이 가능하지만 복잡한 모델이라 계절성이나 장기적인 패턴을 반영하기 어렵습니다. ARMA 모델은 자기회귀와 이동평균을 결합한 복합 모델로 더 정확한 예측이 가능하지만 변수 설정이 까다...2025.01.26
