
총 523개
-
R 언어를 이용한 데이터 크롤링 및 가공2025.04.261. R 언어 R 언어는 통계 및 데이터 분석을 위한 강력한 프로그래밍 언어입니다. R 언어를 이용하여 데이터 크롤링, 전처리, 시각화 등 다양한 작업을 수행할 수 있습니다. R 스튜디오는 R 언어를 사용하기 위한 대표적인 IDE로, 기본적인 통계 및 시각화 기능을 제공하며 다양한 패키지를 통해 복잡한 데이터 분석도 가능합니다. 2. 데이터 크롤링 데이터 크롤링은 웹 상의 데이터를 자동으로 수집하는 기술입니다. R 언어의 twitteR 패키지를 이용하면 트위터 데이터를 크롤링할 수 있습니다. 이를 통해 트위터 데이터를 수집하고 전처...2025.04.26
-
가디언의 데이터 저널리즘 사례 분석2025.04.271. 데이터 저널리즘 데이터 저널리즘은 뉴미디어의 등장으로 다양한 형태의 빅데이터가 쏟아져 나오면서 데이터를 기반으로 분석하여 특정 사회 현상이나 사건을 심층적으로 보도하는 새로운 언론사조입니다. 데이터 저널리즘의 특징은 통계학, 디자인, 프로그래밍, 통찰력 등 다양한 학문을 종합하는 것이며, 핵심정보와 가치, 통찰력을 제공하는 것이 중요합니다. 2. 가디언의 데이터 저널리즘 가디언은 1821년 창간된 주간지 'Manchester Guardian'에서 1959년 8월 이후 'The Guardian'으로 개칭된 영국의 유명 언론사입니...2025.04.27
-
정규 분포를 이용한 불량률 추정 32025.05.121. 불량률 추정 실제 현장에서 대량의 양품 데이터 중에서 일부만 불량으로 발생하는 상황에서, 구간별 불량율을 이론적으로 규정하는 방법을 탐구하였습니다. 세 가지 압력 구간에 대하여 불량율을 각각 2.5%, 5%, 10%로 설정하고, 데이터를 시각적으로 표현하는 방법을 제시하였습니다. 이를 통해 현장에서 데이터 구간별 불량율을 정확하게 규정할 수 있으며, 제품 생산 및 품질 관리에 유용하게 활용될 수 있습니다. 2. 정규 분포 정규 분포를 이용하여 불량률을 추정하는 방법을 제시하였습니다. 대량의 양품 데이터 중에서 일부만 불량으로 ...2025.05.12
-
방송통신대학교 통계데이터학과) R컴퓨팅 출석과제물 (30점 만점 A+)2025.01.261. R 프로그래밍 제출된 자료에는 R 프로그래밍을 활용한 다양한 작업이 포함되어 있습니다. 이를 통해 R 언어의 기본 문법과 통계 함수 사용법, 데이터 처리 및 분석 기법 등을 익힐 수 있습니다. 특히 학번을 이용한 벡터 생성, 결측치 처리, airquality 데이터셋 활용 등의 내용이 포함되어 있습니다. 2. 통계 데이터 분석 제출된 자료에는 통계 데이터 분석과 관련된 내용이 포함되어 있습니다. 벡터 데이터의 평균, 분산, 중앙값 계산, airquality 데이터셋의 결측치 확인 및 분석 등을 통해 통계 데이터 처리 및 분석 ...2025.01.26
-
데이터 마이닝의 정의와 활용 사례2025.01.021. 데이터 마이닝의 이해 데이터 마이닝은 대량의 데이터 세트에서 가치 있는 정보와 통찰력을 추출하는 프로세스입니다. 여기에는 통계 분석, 기계 학습, 패턴 인식 등의 기술을 사용하여 데이터 내 숨겨진 패턴, 상관 관계 및 트렌드를 식별하는 것이 포함됩니다. 데이터 마이닝 프로세스에는 데이터 수집, 정리 및 전처리, 탐색, 모델 구축, 평가, 배치 등의 단계가 포함됩니다. 2. 데이터 마이닝의 응용 데이터 마이닝의 주요 애플리케이션 중 하나는 예측 분석입니다. 이를 통해 기업은 고객 수요를 예측하고 재고를 효율적으로 관리할 수 있습...2025.01.02
-
모수적 추정을 통한 데이터 기반 분포 모형화 3 (Python 코딩)2025.05.131. 모수적 추정 모수적 추정을 통해 데이터를 반영하여 분포 모델을 도출하는 과정과 그 중요성에 대해 다루고 있습니다. 기본적인 수식 y = ax + b*sin(x)에서 a와 b를 임의로 바꾼 후 단 10개의 데이터를 생성하고, 이를 바탕으로 추정을 수행합니다. MCMC 샘플링을 통해 posterior 분포를 추정하고, 이를 시각화하여 파라미터의 불확실성과 추정치의 변동성을 확인합니다. 2. 데이터 기반 모델링 주어진 데이터를 바탕으로 모수적 추정을 수행하여 모델을 도출하는 과정을 설명하고 있습니다. 10개의 데이터만을 사용하여 비...2025.05.13
-
지리정보를 활용한 외장재료 선정활용방안_지리정보시스템 과제_A++2025.01.211. BIM(Building Information Modeling) BIM 모델링을 통해 파사드 외장재료의 종류와 색상, 크기 등을 미리 시뮬레이션해 볼 수 있습니다. 이를 통해 실제 시공 전에 예상 모습을 파악하고 수정사항을 발견할 수 있습니다. BIM은 건축분야 중심으로 활용 중이며, 건설 프로세스 전반에 적용되기 보다는 설계 과정에 국한되어 부분적으로 적용되고 있는 실정입니다. 2. GIS(지리정보시스템) 지리정보시스템(GIS)을 이용하여 지역의 기후나 풍토 등을 고려한 외장재료를 선정할 수 있습니다. 예를 들어, 해안지역에서...2025.01.21
-
방송통신대_빅데이터의이해와활용_중간과제(24년도 2학기, 만점)2025.01.261. 시계열 데이터 분석 기법 시계열 데이터를 분석하기 위한 기법으로 이동평균 모델, 지수평활법, 자기회귀이동평균 모델(ARMA)을 선택하여 각각의 장단점을 설명하였습니다. 이동평균 모델은 데이터의 변동을 부드럽게 만들어 전체적인 추세를 파악할 수 있지만 미래 예측에 한계가 있습니다. 지수평활법은 최신 데이터에 더 큰 가중치를 주어 노이즈를 제거하고 예측이 가능하지만 복잡한 모델이라 계절성이나 장기적인 패턴을 반영하기 어렵습니다. ARMA 모델은 자기회귀와 이동평균을 결합한 복합 모델로 더 정확한 예측이 가능하지만 변수 설정이 까다...2025.01.26
-
파이썬 시험3 (답지 포함)2025.01.241. Python 코드 작성 및 실행 이 문제에서는 Python 코드를 작성하고 실행하는 능력을 평가합니다. 학생들은 주어진 코드의 일부를 완성하고, 새로운 코드를 작성하여 원하는 결과를 출력해야 합니다. 이를 통해 Python 프로그래밍 기초 지식과 문제 해결 능력을 확인할 수 있습니다. 2. 배열 생성 및 기본 연산 이 문제에서는 Python의 배열 생성 및 기본 연산 능력을 평가합니다. 학생들은 1차원 배열과 2차원 배열을 생성하고, 각 요소에 대한 연산을 수행해야 합니다. 이를 통해 Python의 배열 처리 기능에 대한 이해...2025.01.24
-
통계실무 ) 1. 통계는 일상 속에서 많이 활용하고 있는데, 어느 분야에서 어떻게 활용되고 있는 설명하시오. 2. 우리가 모집단(population)에 대해 알아보기 위해 표본(Sample)을 조사하는데 그 이유가 무엇이라고 생각하는지 설명하시오.2025.04.261. 통계 활용 분야 통계는 제품의 기능개선 효과 여부를 설명하는데 많이 활용된다. 홈쇼핑방송의 화장품 광고에서 주름개선 화장품을 예로 들면, 50~60대 시험군을 30명을 대상으로 한달간 실험해본 결과, 제품 사용 전과 4주 사용 후, 주름, 피부수분, 광채, 피부 치밀도, 탄력의 개선율을 %로 제시하는 것을 볼 수 있다. 2. 표본 조사의 이유 모집단은 우리가 측정하고자 하는 집단 전체를 의미하지만, 모집단 전체를 조사하기에는 물리적 한계가 존재하므로 조사가 불가능에 가깝다. 이에 측정가능하며, 모집단을 대표할 수 있는 표본을 ...2025.04.26