총 72개
-
방송통신대학교 통계데이터학과) 회귀모형 출석과제물 (30점 만점 A+)2025.01.261. 회귀모형 자동차의 무게와 자동차를 1km 움직이는 데 필요한 에너지의 양과의 함수관계를 정확히 판단하기 위하여 A 자동차회사는 실험을 통해 자료를 얻었습니다. 이 자료를 이용하여 회귀직선을 구하고 산점도와 함께 그래프로 나타냈습니다. 또한 분산분석을 통해 회귀직선의 유의성을 검정하고, 무게가 3,000kg인 차량의 에너지 소모량을 추정하였습니다. 2. 단순회귀모형 1950년대 미국의 각 주별 피부암 사망자 관련 자료를 이용하여 단순회귀모형을 적합하고 결과를 해석하였습니다. 위도에 대한 회귀계수가 음수로 나타나 위도가 높아질수록...2025.01.26
-
회귀분석 단일회귀분석 다중회귀분석 SPSS2025.05.121. 회귀분석의 정의와 전제조건 회귀분석은 유전학자인 프란시스 갤튼이 발견한 회귀의 법칙에서 유래되었다. 회귀분석은 독립변수와 종속변수 간의 관계를 분석하는 통계기법으로, 세 가지 기본 전제조건이 있다. 첫째, 종속변수의 기댓값은 상수항과 독립변수의 선형결합을 가정한다. 둘째, 오차항은 정규분포를 가정한다. 셋째, 오차항의 평균은 0이고 분산은 상수이며 독립변수와 독립적이다. 2. 단순회귀분석의 정의와 추정 단순회귀분석은 독립변수가 하나인 회귀분석으로, 독립변수가 종속변수에 미치는 영향의 크기와 방향을 분석한다. 최소자승법을 이용하...2025.05.12
-
플랫폼 노동자 근무환경 문제의 통계분석2025.11.151. 플랫폼 노동 플랫폼 노동은 어플이나 SNS 등의 디지털 플랫폼을 매개로 노동력이 거래되는 근로 형태입니다. 배달의민족, 카카오택시 등이 대표적 사례이며, 우리 삶과 밀접한 연관을 가지고 있습니다. 그러나 새로운 사업형태로 아직 법제화되지 않은 부분이 많아 플랫폼 기업의 과한 시장 경쟁으로 인해 하위 노동자가 일방적으로 피해를 받고 있는 현실입니다. 2. 단순 선형회귀분석 R프로그래밍을 이용하여 배달 주문 수와 이륜차 교통사고 사상자 수 간의 상관관계를 분석한 통계 방법입니다. 독립변수인 주문 수가 종속변수인 이륜차 교통사고 사...2025.11.15
-
2024년 1학기 방송통신대 통계학개론 출석대체과제물2025.01.251. 히스토그램 히스토그램은 데이터의 분포를 시각적으로 나타내는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 히스토그램을 그릴 수 있습니다. 2. 상자그림 상자그림은 데이터의 중앙값, 사분위수, 최솟값, 최댓값 등을 한눈에 볼 수 있는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 상자그림을 그릴 수 있습니다. 3. 다섯수치요약 다섯수치요약은 데이터의 최솟값, 제1사분위수, 중앙값, 평균값, 제3사분위수, 최댓값을 나타내는 통계량입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 다섯수치...2025.01.25
-
머신러닝과 딥러닝을 이용한 와인 품질 분류2025.11.171. 데이터 전처리 및 이상치 제거 와인 품질 데이터셋(4898개 샘플, 12개 변수)에서 결측치 확인 후 IQR 방법을 이용하여 이상치를 제거했다. 고정산도, 휘발성산도, 구연산 등 11개 설명변수에서 총 925개의 이상치가 제거되어 최종 3973개 샘플로 축소되었다. 이상치 제거 후 데이터의 품질이 향상되고 모델의 예측력이 개선되었다. 2. 데이터 정규화 및 스케일링 StandardScaler와 MinMaxScaler를 적용하여 서로 다른 범위의 변수들을 동일한 스케일로 변환했다. 염소화물(0.012~0.346)과 총 이산화황(...2025.11.17
-
중다회귀 분석2025.11.131. 중다회귀분석 중다회귀분석은 하나의 종속변수와 두 개 이상의 독립변수 간의 관계를 분석하는 통계적 방법입니다. 여러 예측변수를 동시에 고려하여 종속변수의 변화를 설명하고 예측하는 데 사용되며, 각 독립변수의 상대적 영향력을 파악할 수 있습니다. 2. 회귀계수 회귀계수는 중다회귀모델에서 각 독립변수가 종속변수에 미치는 영향의 크기와 방향을 나타내는 수치입니다. 표준화된 회귀계수와 비표준화 회귀계수로 구분되며, 통계적 유의성 검정을 통해 각 변수의 기여도를 평가합니다. 3. 모형적합도 모형적합도는 회귀모델이 실제 데이터를 얼마나 잘...2025.11.13
-
2023년 1학기 통계학개론 출석수업 중간과제 리포트 30점 만점2025.01.251. 히스토그램 그리기 12명의 학생이 읽은 책 수에 대한 히스토그램을 그렸습니다. 히스토그램을 통해 데이터의 분포를 시각적으로 확인할 수 있습니다. 2. 상자그림 그리기 12명의 학생이 읽은 책 수에 대한 상자그림을 그렸습니다. 상자그림을 통해 데이터의 다섯 수치 요약(최소값, 1사분위수, 중앙값, 3사분위수, 최대값)을 확인할 수 있습니다. 3. t 검정 12명의 학생이 읽은 책 수에 대한 t 검정을 수행했습니다. t 검정 결과 p-value가 매우 작게 나와 해당 데이터가 통계적으로 유의미하다고 해석할 수 있습니다. 4. 대응...2025.01.25
-
데이터마이닝 ) 나무 형태를 이용한 지식 표현 사례2025.01.031. 의사결정나무 의사결정나무는 예측모형에서 가장 많이 사용되며 의사결정 규칙을 도표화하여 대상 집단을 분류하거나 예측하는 분석 방법입니다. 의사결정나무의 장점은 나무구조에 의해 모형이 표현되어 사용자의 이해가 쉽고, 유용한 예측변수나 비선형성을 자동으로 찾아낼 수 있으며, 선형성이나 정규성, 등분산성과 같은 가정을 필요로 하지 않는 비모수적인 방법이라는 것입니다. 하지만 의사결정나무 모형은 연속형 변수를 비연속적인 값으로 취급하여 분리의 경계점에서 예측오류가 큰 가능성이 있고, 선형성과 주 효과를 가지지 못한다는 단점이 있습니다....2025.01.03
-
[인공지능의세계 A+] 기말고사 문제풀이 객관식 + 서술형 + 단답형 문제+해설2025.05.101. 기계학습 기계학습은 인간의 학습능력을 기계나 컴퓨터에서 구현한 것으로, 지도학습과 비지도학습으로 구분할 수 있다. 지도학습은 학습 데이터의 정답이 주어지는 반면, 비지도학습은 정답이 주어지지 않는다. 신경망은 자동으로 가중치를 학습하는 기계학습 방식이다. 강화학습은 보상을 통해 최적의 행동을 학습하는 방식으로, 알파고가 자체 연습 대국을 통해 좋은 수를 학습하는 데 사용되었다. 2. 클러스터링 K-Means 클러스터링은 데이터를 K개의 클러스터로 분류하는 방법이다. K-Means 클러스터링의 단점은 k의 개수를 사전에 정해야 ...2025.05.10
-
KBO 야구 선수 신체 조건과 타율 관계 분석2025.11.171. 신체 조건과 타율의 관계 롯데자이언츠 선수들을 대상으로 키, 몸무게 등 신체 조건이 타율에 미치는 영향을 분석했습니다. 단순회귀분석을 통해 키와 타율의 관계를 검증한 결과, 결정계수(R²)가 6.55%로 매우 낮고 F-Value가 1.82로 낮은 수치를 보였으며, t값의 유의확률이 0.05를 초과하여 통계적으로 유의미한 선형관계가 없음을 확인했습니다. 2. 다중공선성 문제 키와 몸무게 변수 간에 높은 상관관계가 존재하여 다중공선성 문제가 발생합니다. 키가 클수록 몸무게도 증가하는 경향이 있기 때문에 두 변수를 동시에 사용한 다...2025.11.17
