총 184개
-
30점 만점 방통대 데이터마이닝 2024-1학기2025.01.261. 데이터마이닝 방법론 데이터마이닝의 방법은 크게 모수적 모형 접근 방법과 알고리즘 접근 방법으로 나뉜다. 모수적 모형 접근법은 기존 데이터를 기반으로 모수를 추정하는 방법이며, 알고리즘 접근방법은 정해진 알고리즘에 따라 데이터를 학습하는 방법이다. 각각의 장단점이 있으며, 상황에 따라 적절한 방법을 선택해야 한다. 2. 모수적 모형 접근법 모수적 모형 접근법은 단순 선형 회귀분석, 로지스틱 회귀모형 등이 해당된다. 기본 모형 식이 존재하며, 모수를 추정하는 방식으로 결과가 복잡하지 않고 해석이 용이하다. 그러나 데이터가 가정한 ...2025.01.26
-
조사결과에 영향을 미치는 외생변수들 중 3가지를 임의로 선택하고, 그 영향을 최소화할 수 있는 방안에 대해 작성해 보시오.2025.04.271. 외생변수의 종류 외생변수의 종류에는 검사 효과, 통계적 회귀 현상, 피험자의 탈락 등이 있다. 검사 효과는 사전 검사 경험이 이후 검사에 영향을 미치는 것이고, 통계적 회귀 현상은 극단적인 피험자를 선정했을 때 발생하는 현상이며, 피험자의 탈락은 연구 도중 피험자가 빠져나가면서 집단 간 비교가 어려워지는 것을 말한다. 2. 외생변수의 최소화 방안 검사 효과를 해소하기 위해 솔로몬 4집단 설계를 사용할 수 있다. 통계적 회귀 현상은 극단적인 피험자를 배제하거나 다양한 변수를 고려하여 선정하는 방법으로 줄일 수 있다. 피험자의 탈...2025.04.27
-
방통대 통계데이터과학과 R데이터분석 A+2025.01.241. 성과점수 분석 1. 연구 종료 시점에서의 성과점수(t2)의 상자그림을 성별로 나란히 그렸습니다. 그래프의 제목으로 본인의 학번을 넣었습니다. 2. 성별에 따라 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 성별에 따른 성과점수의 평균에 차이가 있는 것으로 나타났습니다(p-value = 0.04677<0.05). 3. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균을 구했습니다. 4. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 스트레...2025.01.24
-
방통대 [데이터마이닝] 2024 출석과제물 (30점 만점 인증 / 표지제외 12페이지 분량 / 코드 및 해설 포함)2025.01.251. 모수적 모형 접근법 모수적 모형 접근법은 통계를 사용하여 데이터의 특징과 의미를 해석할 수 있는 분석 모델을 만드는 전통적인 방법입니다. 주로 사용하는 모형으로는 선형 회귀분석, 로지스틱 회귀모형이 있으며 모델 내에서 a 또는 b 같은 모수를 최소제곱법 또는 최대우도추정법을 사용하여 추정합니다. 모수적 모형 접근법으로 만들어진 분석 모델은 원인과 결과에 대한 설명이 용이하다는 장점이 있지만, 분석 모델을 만드는데 사용했던 데이터가 아닌 다른 데이터를 사용할 경우 정확도가 낮아지거나 적용 자체가 불가능할 수 있다는 단점이 있습니...2025.01.25
-
2023년 1학기 통계학개론 출석수업 중간과제 리포트 30점 만점2025.01.251. 히스토그램 그리기 12명의 학생이 읽은 책 수에 대한 히스토그램을 그렸습니다. 히스토그램을 통해 데이터의 분포를 시각적으로 확인할 수 있습니다. 2. 상자그림 그리기 12명의 학생이 읽은 책 수에 대한 상자그림을 그렸습니다. 상자그림을 통해 데이터의 다섯 수치 요약(최소값, 1사분위수, 중앙값, 3사분위수, 최대값)을 확인할 수 있습니다. 3. t 검정 12명의 학생이 읽은 책 수에 대한 t 검정을 수행했습니다. t 검정 결과 p-value가 매우 작게 나와 해당 데이터가 통계적으로 유의미하다고 해석할 수 있습니다. 4. 대응...2025.01.25
-
머신러닝과 딥러닝을 이용한 와인 품질 분류2025.11.171. 데이터 전처리 및 이상치 제거 와인 품질 데이터셋(4898개 샘플, 12개 변수)에서 결측치 확인 후 IQR 방법을 이용하여 이상치를 제거했다. 고정산도, 휘발성산도, 구연산 등 11개 설명변수에서 총 925개의 이상치가 제거되어 최종 3973개 샘플로 축소되었다. 이상치 제거 후 데이터의 품질이 향상되고 모델의 예측력이 개선되었다. 2. 데이터 정규화 및 스케일링 StandardScaler와 MinMaxScaler를 적용하여 서로 다른 범위의 변수들을 동일한 스케일로 변환했다. 염소화물(0.012~0.346)과 총 이산화황(...2025.11.17
-
전동 킥보드 수요 예측을 통한 서비스 활성화 전략2025.01.241. 수요 예측의 개념 수요 예측은 미래의 수요를 예측하는 과정으로, 과거 데이터를 기반으로 특정 서비스나 제품이 미래에 어느 정도 사용될지를 예측하는 것입니다. 정확한 수요 예측은 자원 배분의 효율성을 높이는 데 중요합니다. 특히 전동 킥보드 서비스 제공 기업의 경우 킥보드의 적재적소 배치가 필수적이기 때문에 수요 예측이 더욱 중요합니다. 2. 수요 예측 방법 전동 킥보드 수요 예측을 위한 대표적인 방법으로는 시계열 분석, 회귀 분석, 인공지능(AI) 기반 예측 등이 있습니다. 시계열 분석은 과거 데이터를 분석하여 미래 수요 패턴...2025.01.24
-
R을 이용한 남성과 여성의 신체치수 비교 분석2025.11.171. 로지스틱 회귀 모형 성별을 반응변수로 하여 로지스틱 모형을 적합시켰다. 키, 몸무게, 가슴둘레, 발직선길이, 골격근량, 단백질은 증가할수록 남성일 확률이 높아지고, 허리너비와 엉덩이둘레는 증가할수록 여성일 확률이 높아진다. 장딴지둘레와 체지방량은 유의하지 않아 남녀간 차이가 없다. 부분 F검정을 통해 유의하지 않은 변수를 제거한 모형이 더 적합함을 확인했다. 2. 비례 오즈 모형 연령대를 순서가 있는 반응변수로 하여 비례 오즈 모형을 적합시켰다. 키, 엉덩이둘레, 장딴지둘레, 체지방량이 증가할수록 나이가 어릴 가능성이 높고, ...2025.11.17
-
[인공지능의세계 A+] 기말고사 문제풀이 객관식 + 서술형 + 단답형 문제+해설2025.05.101. 기계학습 기계학습은 인간의 학습능력을 기계나 컴퓨터에서 구현한 것으로, 지도학습과 비지도학습으로 구분할 수 있다. 지도학습은 학습 데이터의 정답이 주어지는 반면, 비지도학습은 정답이 주어지지 않는다. 신경망은 자동으로 가중치를 학습하는 기계학습 방식이다. 강화학습은 보상을 통해 최적의 행동을 학습하는 방식으로, 알파고가 자체 연습 대국을 통해 좋은 수를 학습하는 데 사용되었다. 2. 클러스터링 K-Means 클러스터링은 데이터를 K개의 클러스터로 분류하는 방법이다. K-Means 클러스터링의 단점은 k의 개수를 사전에 정해야 ...2025.05.10
-
생산관리 10주차: 상관계수, 결정계수, 추적신호, 프로젝트관리2025.11.131. 상관계수(Coefficient of Correlation) 상관계수는 두 변수 간의 관계 강도를 측정하는 지표로, r로 표기되며 -1에서 +1 사이의 값을 갖습니다. r값이 1에 가까울수록 양의 상관관계가 강하고, -1에 가까울수록 음의 상관관계가 강하며, 0에 가까울수록 상관관계가 없습니다. 절대값이 1에 가까울수록 두 변수의 관계가 잘 표현됩니다. 예제에서 0.901의 상관계수는 급여와 판매 간의 강한 양의 상관관계를 나타냅니다. 2. 결정계수(Coefficient of Determination) 결정계수는 상관계수를 제곱...2025.11.13
