총 34개
-
방송통신대학교 통계데이터학과) 파이썬과 R 출석수업과제물 (30점 만점 A+)2025.01.261. R 데이터프레임 생성 R을 사용하여 name, height, weight 3개의 열을 갖는 데이터프레임을 생성하고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 2. 파이썬 딕셔너리 생성 x1, x2, x3 리스트를 사용하여 name, height, weight 키를 가진 파이썬 딕셔너리를 생성하였습니다. 3. 파이썬 데이터프레임 생성 파이썬에서 생성한 딕셔너리를 사용하여 데이터프레임을 만들고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 4. 파이썬 함수...2025.01.26
-
방송통신대학교 통계데이터학과) R컴퓨팅 출석과제물 (30점 만점 A+)2025.01.261. R 프로그래밍 제출된 자료에는 R 프로그래밍을 활용한 다양한 작업이 포함되어 있습니다. 이를 통해 R 언어의 기본 문법과 통계 함수 사용법, 데이터 처리 및 분석 기법 등을 익힐 수 있습니다. 특히 학번을 이용한 벡터 생성, 결측치 처리, airquality 데이터셋 활용 등의 내용이 포함되어 있습니다. 2. 통계 데이터 분석 제출된 자료에는 통계 데이터 분석과 관련된 내용이 포함되어 있습니다. 벡터 데이터의 평균, 분산, 중앙값 계산, airquality 데이터셋의 결측치 확인 및 분석 등을 통해 통계 데이터 처리 및 분석 ...2025.01.26
-
방통대 통계데이터학과 R컴퓨팅 A+2025.01.241. R 프로그래밍 이 프레젠테이션은 R 프로그래밍 언어를 사용하여 다양한 통계 작업을 수행하는 방법을 다룹니다. 주요 내용으로는 벡터 생성, 통계 함수 사용, 결측치 처리, 데이터 추출 및 조작, 성적 등급 부여, 반복문 활용 등이 포함됩니다. 2. 통계 데이터 분석 이 프레젠테이션은 R 프로그래밍을 통해 통계 데이터를 분석하는 방법을 소개합니다. 주요 내용으로는 USArrests 데이터셋을 활용한 데이터 추출 및 통계량 계산, 모의시험 점수 데이터를 이용한 성적 등급 부여 등이 포함됩니다. 3. 반복문 활용 이 프레젠테이션은 f...2025.01.24
-
융합시스템공학입문 - 딥러닝응용 학습계획2025.11.171. 스마트생산과 딥러닝 스마트생산은 정보기술과 자동화기술을 활용하여 생산과정을 효율적으로 관리하는 방법이다. 딥러닝은 스마트생산에서 이미지인식, 예측분석, 자동화, 품질개선 등 다양한 측면에서 중요한 역할을 한다. 센서기술로 데이터를 수집하고 인공지능과 머신러닝으로 생산계획을 최적화하며, 딥러닝을 활용하여 생산효율화와 품질향상, 자동화강화를 통해 생산성을 향상시킬 수 있다. 2. 딥러닝 학습의 수학적 기초 딥러닝은 선형대수, 미적분, 확률과통계 등의 수학적 개념에 기반하고 있어 수학적 지식을 요구한다. 수학적 이론과 공식이 이해하...2025.11.17
-
계절학기 수강신청 추천 프로그램 개발2025.11.171. 데이터 전처리 및 크롤링 BeautifulSoup과 Pandas 라이브러리를 활용하여 웹페이지에서 계절학기 교과목, 학사일정, 공지사항 데이터를 수집하고 정제했습니다. urllib를 이용한 정적 웹페이지 크롤링, HTML 파싱을 통해 필요한 정보를 추출하고, 결측값 처리 및 데이터 가공을 수행했습니다. CSV 형식의 교과목 데이터와 HTML 형식의 학사일정 데이터를 통합하여 분석 가능한 형태로 변환했습니다. 2. 프로그램 알고리즘 및 함수 설계 학생 정보 입력을 통해 전공/일선/교양 구분을 수행하고, 관심 분야 입력에 따라 과...2025.11.17
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
간호연구 전범위 필기노트2025.05.141. 측정의 의미 측정은 변수에 값을 부여하는 것으로, 개념을 경험적(현실)세계의 자료와 연결시켜주는 과정이다. 측정 시 고려해야 할 점은 신뢰성과 타당성이다. 신뢰성은 반복연구에서 얼마나 동일한 결과가 나오는지, 타당성은 측정하고자 하는 것을 제대로 측정하고 있는지를 나타낸다. 2. 측정 수준 측정의 범위에 따라 명목, 서열, 등간, 비율 측정 수준으로 구분된다. 명목 측정은 단순 분류, 서열 측정은 분류와 서열화, 등간 측정은 분류, 서열화, 간격화, 비율 측정은 분류, 서열화, 간격화, 비율화를 포함한다. 3. 측정오차 측정오...2025.05.14
-
2023년 1학기 방통대 R컴퓨팅 출석수업 중간과2025.01.251. R 프로그래밍 R은 약 20년 전 어문계 사범대학을 졸업하고 이후 제약회사의 국내외 업무를 하다가 금년도 이렇게 방송통신대학교 통계-데이터과학과에 편입하고서야 처음 접하게 되는 프로그래밍 언어입니다. 이전까지는 R의 R자도 들어보지 못하였고, 첫학기(한학기)의 중반이 넘어가고 있는 지금에도 아직 생경한 것이 사실입니다. 다행인 것은 이 R컴퓨팅 과목뿐만 아니라 함께 수강하고 있는 몇 과목들, 예를 들어 통계학개론이나 정보처리입문과 같은 과목에서 R에 대해 부분적으로 반복적으로 배울 수 있어 학습-습득에 도움이 되고 있습니다. ...2025.01.25
-
머신러닝과 딥러닝을 이용한 와인 품질 분류2025.11.171. 데이터 전처리 및 이상치 제거 와인 품질 데이터셋(4898개 샘플, 12개 변수)에서 결측치 확인 후 IQR 방법을 이용하여 이상치를 제거했다. 고정산도, 휘발성산도, 구연산 등 11개 설명변수에서 총 925개의 이상치가 제거되어 최종 3973개 샘플로 축소되었다. 이상치 제거 후 데이터의 품질이 향상되고 모델의 예측력이 개선되었다. 2. 데이터 정규화 및 스케일링 StandardScaler와 MinMaxScaler를 적용하여 서로 다른 범위의 변수들을 동일한 스케일로 변환했다. 염소화물(0.012~0.346)과 총 이산화황(...2025.11.17
-
[사회복지조사론] 2차 자료분석의 개념과 장단점 및 접근방법2025.01.101. 2차 자료분석의 개념 2차 분석(secondary analysis)이란 비관여적 조사(unobtrusive research) 방법 중의 하나로서, 기존 통계자료로부터 연구에 필요한 자료를 도출해내는 방법을 뜻한다. 이것은 기존에 다른 조사자가 수집한 1차 자료를 정리하여 새로운 통계자료를 만들고, 그렇게 만들어진 통계자료를 이용하고 분석하여 연구자가 연구하고자 하는 문제를 밝혀내는 데 목적이 있다. 2. 2차 자료분석의 장점 2차 자료분석의 장점은 시간과 비용 절약, 양질의 자료 확보, 조사 대상자와의 상호작용 없음, 종단 자...2025.01.10
