
총 89개
-
회귀분석 단일회귀분석 다중회귀분석 SPSS2025.05.121. 회귀분석의 정의와 전제조건 회귀분석은 유전학자인 프란시스 갤튼이 발견한 회귀의 법칙에서 유래되었다. 회귀분석은 독립변수와 종속변수 간의 관계를 분석하는 통계기법으로, 세 가지 기본 전제조건이 있다. 첫째, 종속변수의 기댓값은 상수항과 독립변수의 선형결합을 가정한다. 둘째, 오차항은 정규분포를 가정한다. 셋째, 오차항의 평균은 0이고 분산은 상수이며 독립변수와 독립적이다. 2. 단순회귀분석의 정의와 추정 단순회귀분석은 독립변수가 하나인 회귀분석으로, 독립변수가 종속변수에 미치는 영향의 크기와 방향을 분석한다. 최소자승법을 이용하...2025.05.12
-
데이터 마이닝, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 데이터 마이닝 기법 데이터 마이닝은 데이터에서 의미를 추출하는 기법을 의미하며, 모수적 모형 접근 방법과 알고리즘 접근 방법이 모두 활용될 수 있다. 모수적 모형 접근법은 모형을 설정하고 모수를 추정하는 방식이며, 알고리즘 접근법은 정해진 알고리즘으로 계산하여 결과를 분석하는 방식이다. 각각의 장단점이 있으며, SNS 텍스트 데이터 분석에 활용할 수 있다. 2. 로지스틱 회귀모형 적합 와인 품질 데이터에 로지스틱 회귀모형을 적합하였다. alcohol 변수만 사용한 모형, sulphates 변수만 사용한 모형, 그리고 유의미한 ...2025.01.25
-
경영통계학의 통계분석 방법에서 통계분석의 과정2025.05.151. 회귀분석 회귀분석은 변수들 간의 인과관계를 분석하는 데 사용되는 통계기법으로서, 주로 의사결정나무나 판별분석 등 다른 통계분석 기법들이 예측력이 부족하거나 적용할 수 없는 상황에서 활용된다. 회귀분석에는 단순회귀분석과 다중회귀분석이 있으며, 이를 통해 독립변수와 종속변수 간의 관계를 파악하여 예측하거나 설명할 수 있다. 2. 표본추출방법론 표본추출방법론에는 단순무작위표본추출법, 계통추출법, 군집표본추출법, 층화표본추출법, 다단계표본추출법 등이 있으며, 각 기법들의 장단점과 특성을 이해하고 적절한 방법을 선택할 수 있어야 한다....2025.05.15
-
외생변수란 무엇이며, 왜 문제가 되는지 강의내용을 중심으로 작성하시오2025.01.191. 외생변수의 정의 외생변수는 독립변수 이외 변수를 뜻하는 말로 종속변수에 영향을 주기 때문에 이를 통제하지 않게 되면 연구결과의 내적타당도에 문제가 되는 변수를 의미한다. 실험설계의 타당도 종류는 내적 타당도와 외적타당도가 존재하는데 내적 타당성을 저해하는 요인으로는 역사요인, 성숙요인, 검사요인, 통계적 회귀, 선발요인, 상실요인, 모방요인, 도구요인이 있다. 2. 외생변수의 종류 외생변수의 종류에는 우연적 사건, 성숙효과, 시험효과, 측정수단의 변화, 통계적 회귀, 표본의 편중, 실험대상의 소멸, 인과방향의 모호성, 실험변수...2025.01.19
-
모수적 추정을 통한 데이터 기반 분포 모형화 2 (Python 코딩)2025.05.131. 모수적 추정 모수적 추정은 주어진 수학적 모델의 파라미터를 데이터를 이용하여 추정하는 방법으로, 데이터의 불확실성을 모델링하고 신뢰성 있는 결론을 도출하는데 유용합니다. 모수적 추정의 기본 개념과 원리를 설명하고, 이를 활용하여 실제 데이터를 분석하여 모델의 파라미터를 추정하는 예시를 제시할 것입니다. 2. 모수적 방법과 비모수적 방법 모수적 방법과 비모수적 방법은 데이터를 모델링하는 데 사용되는 접근 방식에 차이가 있습니다. 두 방법은 데이터에 대한 가정과 모델의 유연성 측면에서 서로 다릅니다. 블로그에서는 두 방법을 비교하...2025.05.13
-
2024년 1학기 방송통신대 통계학개론 출석대체과제물2025.01.251. 히스토그램 히스토그램은 데이터의 분포를 시각적으로 나타내는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 히스토그램을 그릴 수 있습니다. 2. 상자그림 상자그림은 데이터의 중앙값, 사분위수, 최솟값, 최댓값 등을 한눈에 볼 수 있는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 상자그림을 그릴 수 있습니다. 3. 다섯수치요약 다섯수치요약은 데이터의 최솟값, 제1사분위수, 중앙값, 평균값, 제3사분위수, 최댓값을 나타내는 통계량입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 다섯수치...2025.01.25
-
한국방송통신대학교 통계데이터과학과 엑셀데이터분석 2021년 기말과제(만점)2025.01.251. 확률 계산 문제 1에서는 이항분포와 포아송분포를 이용하여 다양한 확률 값을 계산하는 방법을 다루고 있습니다. 엑셀의 BINOMDIST, POISSON 함수를 활용하여 확률을 구하는 과정이 자세히 설명되어 있습니다. 2. 정규분포와 표본평균 문제 2에서는 정규분포를 따르는 모집단에서 표본을 추출하여 표본평균의 분포를 구하는 방법을 다루고 있습니다. 엑셀의 NORMDIST 함수를 이용하여 정규분포의 확률을 계산하고, 중심극한정리를 활용하여 표본평균의 분포를 구하는 과정이 설명되어 있습니다. 3. 이항분포의 정규근사 문제 2에서는 ...2025.01.25
-
방통대 [데이터시각화] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 워드 클라우드 워드 클라우드는 텍스트 데이터에서 단어의 빈도 수가 높을수록 큰 글씨로 표현하는 시각화 기법이다. 주제나 핵심 키워드를 쉽고 효과적으로 전달할 수 있다는 장점이 있다. SNS 데이터에서 인기 키워드를 찾거나 연설문에서 핵심 내용과 주제를 찾는데 유용하게 사용될 수 있다. 또한 온라인 게시글에서 여론을 찾아내기도 하며 고객 리뷰에 대한 요약을 제공하기도 한다. 특히나 미국 대선 때 사용되는 워드 클라우드에서는 각 후보자의 핵심 공약이나 정책 방향, 이슈, 유권자들이 중요하게 생각하는 가치관을 직관적으로 확인할 수 ...2025.01.25
-
데이터마이닝 ) 나무 형태를 이용한 지식 표현 사례2025.01.031. 의사결정나무 의사결정나무는 예측모형에서 가장 많이 사용되며 의사결정 규칙을 도표화하여 대상 집단을 분류하거나 예측하는 분석 방법입니다. 의사결정나무의 장점은 나무구조에 의해 모형이 표현되어 사용자의 이해가 쉽고, 유용한 예측변수나 비선형성을 자동으로 찾아낼 수 있으며, 선형성이나 정규성, 등분산성과 같은 가정을 필요로 하지 않는 비모수적인 방법이라는 것입니다. 하지만 의사결정나무 모형은 연속형 변수를 비연속적인 값으로 취급하여 분리의 경계점에서 예측오류가 큰 가능성이 있고, 선형성과 주 효과를 가지지 못한다는 단점이 있습니다....2025.01.03
-
외생변수란 무엇이며, 왜 문제가 되는지 강의내용을 중심으로 작성하시오2025.01.221. 외생변수 외생변수는 실험을 진행할 때 독립변수 이외에 종속변수에 영향을 미치는 변수를 말한다. 외생변수는 실험의 내적 타당성을 낮추어 연구 결과의 정확성을 떨어뜨릴 수 있다. 외생변수에는 우연적 사건, 성숙 효과, 시험 효과, 시험 단위 선정의 오류, 측정 방법의 변화, 시험 단위의 소멸, 통계적 회귀 현상, 실험 대상자의 실험 목적 예상 등 다양한 유형이 있다. 외생변수를 완벽히 통제하기는 어렵지만, 실험 설계를 견고히 하고 무작위화 등의 방법을 통해 외생변수의 영향을 최소화할 수 있다. 1. 외생변수 외생변수는 경제 모형에...2025.01.22