총 3,660개
-
빅데이터의 개념과 특징, 기업의 활용 사례2025.01.221. 빅데이터의 개념과 특징 빅데이터는 데이터의 양, 속도, 다양성이라는 세 가지 주요 특징을 가집니다. 데이터의 양은 기하급수적으로 증가하고 있어 전통적인 데이터베이스 시스템으로는 저장하고 처리하기 어렵습니다. 데이터의 속도는 매우 빨라 실시간 분석과 처리가 필요합니다. 데이터의 다양성은 구조적 데이터와 비구조적 데이터를 포함하며, 이를 처리하고 분석하기 위해서는 고도의 분석 기법과 기술이 필요합니다. 2. 기업의 빅데이터 활용 사례 아마존은 고객의 구매 이력, 검색 기록, 클릭 패턴 등을 분석하여 개인 맞춤형 추천 시스템을 운영...2025.01.22
-
대구가톨릭대학교 파이썬프로그래밍기초 4주차 솔루션2025.05.031. 1차원 리스트 인덱싱 및 슬라이싱 1차원 리스트에 대한 인덱싱과 슬라이싱을 수행한 결과를 확인하고, 양수 인덱스와 음수 인덱스를 사용하여 동일한 출력 결과를 얻는 방법을 실습하였습니다. 2. 2차원 리스트 인덱싱 및 슬라이싱 2차원 리스트에 대한 인덱싱과 슬라이싱을 수행한 결과를 확인하고, 양수 인덱스와 음수 인덱스를 사용하여 동일한 출력 결과를 얻는 방법을 실습하였습니다. 3. 삼중 구조 리스트 인덱싱 삼중 구조 리스트에 대한 인덱싱을 수행한 결과를 확인하고, 양수 인덱스와 음수 인덱스를 사용하여 동일한 출력 결과를 얻는 방...2025.05.03
-
하둡 구현 보고서2025.05.071. VMware VMware는 가상 PC를 만들어 주는 프로그램으로, 실제 PC와 동일한 환경의 가상 PC를 만들 수 있다. 이를 통해 다른 운영체제를 설치하여 사용할 수 있다. 2. Hadoop Hadoop은 대용량 데이터를 적은 비용으로 빠르게 분석할 수 있는 소프트웨어이다. 여러 대의 컴퓨터로 데이터를 분석하고 저장하는 방식으로 비용과 시간을 단축할 수 있다. Hadoop은 HDFS(분산 데이터 저장)와 MapReduce(분산 처리) 프레임워크로 시작되었으며, 데이터 저장, 실행 엔진, 프로그래밍 등 Hadoop 생태계 전반...2025.05.07
-
방송통신대학교 통계데이터학과) 파이썬과 R 출석수업과제물 (30점 만점 A+)2025.01.261. R 데이터프레임 생성 R을 사용하여 name, height, weight 3개의 열을 갖는 데이터프레임을 생성하고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 2. 파이썬 딕셔너리 생성 x1, x2, x3 리스트를 사용하여 name, height, weight 키를 가진 파이썬 딕셔너리를 생성하였습니다. 3. 파이썬 데이터프레임 생성 파이썬에서 생성한 딕셔너리를 사용하여 데이터프레임을 만들고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 4. 파이썬 함수...2025.01.26
-
[A+] 데이터 과학, 데이터 애널리틱스, 데이터 분석, 인공지능, 머신러닝, 딥러닝 단어 설명 (무역학과 글로벌비즈니스애널리틱스)2025.01.241. 데이터 과학 데이터 과학은 방대한 데이터를 수집, 처리, 분석하여 의미 있는 정보를 추출하는 과정을 연구하는 학문입니다. 데이터 과학은 다양한 통계적 기법과 머신러닝 알고리즘을 사용하여 데이터를 기반으로 유의미한 통찰을 도출하고, 이를 통해 비즈니스 문제를 해결합니다. 데이터 과학은 데이터 엔지니어링, 데이터 분석, 모델링, 시각화, 그리고 결과 해석의 과정을 포함하여 기업이 데이터를 통해 실질적인 가치를 얻을 수 있도록 돕습니다. 2. 데이터 애널리틱스 데이터 애널리틱스는 데이터를 기반으로 특정 문제를 분석하고, 그에 대한 ...2025.01.24
-
빅데이터의 특성, 기능, 기업 활용사례 및 향후 방안2025.11.151. 빅데이터의 개념 및 구분 빅데이터는 단순히 방대한 데이터량을 의미하는 것이 아니라 방대한 데이터로부터 가치를 추출하고 분석하는 기술이다. 빅데이터는 정형데이터(관계형 데이터베이스, 스프레드시트), 비정형데이터(텍스트, 이미지, 동영상, 음성), 반정형데이터(XML, HTML)로 구분된다. 이러한 다양한 형태의 데이터를 효과적으로 관리하고 분석하는 것이 빅데이터 활용의 핵심이다. 2. 빅데이터의 주요 특성 빅데이터의 주요 특성은 규모, 다양성, 복잡성, 속도이다. 규모는 디지털 정보량의 기하급수적 증가로 제타바이트 시대 진입을 ...2025.11.15
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
데이터 유형과 데이터 주도권에 대한 이해2025.01.251. 데이터 유형 데이터는 범주형 데이터와 수치형 데이터로 구분되며, 범주형 데이터는 다시 명목형 데이터와 순서형 데이터로, 수치형 데이터는 연속형 데이터와 이산형 데이터로 나뉜다. 각 데이터 유형의 특징과 예시를 설명하였다. 2. 데이터 주도권 데이터 사용자에게 필요한 5가지 소양인 이해력, 인문학적 소양, 통찰력, 윤리의식, 유연성을 'CHIEF'라는 용어로 설명하였다. 이 중 인문학적 소양과 통찰력을 집중적으로 갖추고자 하는 이유와 목표를 제시하였다. 3. 데이터베이스 모델 계층형, 네트워크형, 관계형 데이터베이스 모델의 특징...2025.01.25
-
컴퓨터 시스템의 종류에 대하여 구체적으로 설명하시오2025.04.251. 일괄 처리 시스템 일괄 처리 시스템은 수집된 변동자료(Transaction data)를 일정 기간 동안 모아두었다가, 필요한 시점에서 한꺼번에 이 자료들을 컴퓨터에 입력하여 실행한 후 그 결과를 출력시키는 방식이다. 이러한 방식은 전화 요금, 수도세, 전기세와 같이 일정한 기간마다 정리가 필요한 분야에 사용된다. 일괄 처리 시스템의 표준 처리 패턴은 매체 변환, 병합, 대조, 추출, 생성, 정렬, 조합, 갱신, 분배, 보고서 작성으로 이루어진다. 2. 실시간 시스템 실시간 시스템은 직접성과 시한성을 가지고 있는 자료를 사람의 ...2025.04.25
-
4차 산업혁명과 관련된 정보기술 빅데이터의 개념, 특성 및 활용2025.04.251. 빅데이터의 개념과 특성 빅데이터는 기존 데이터베이스 소프트웨어로는 저장, 관리, 분석이 어려운 대용량의 데이터 집합을 의미합니다. 빅데이터는 3V 특징을 가지고 있는데, 이는 volume(규모), variety(다양성), velocity(속도)를 의미합니다. 빅데이터는 기존 데이터 분석보다 훨씬 많은 데이터를 다루며, 정형 데이터뿐만 아니라 비정형 데이터도 포함하고 있습니다. 2. 빅데이터 활용 기술 빅데이터를 활용하는 기술에는 빅데이터 수집, 저장 및 관리, 전처리, 분석, 시각화, 공유 기술 등이 있습니다. 이러한 기술들은...2025.04.25
