소개글
"빅데이터의 정의, 빅데이터의 종류"에 대한 내용입니다.
목차
1. 서론
2. 빅데이터의 정의
2.1. 빅데이터의 개념
2.2. 구조화 데이터와 비구조화 데이터
3. 빅데이터의 특징
3.1. 빅데이터의 4가지 특징
3.1.1. 다양성
3.1.2. 진실성
3.1.3. 대량성
3.1.4. 속도
3.2. 기타 빅데이터의 특징
4. 빅데이터 분석 기술
4.1. 군집 분석
4.2. 장바구니 분석
5. 결론
6. 참고 문헌
본문내용
1. 서론
바야흐로 빅데이터 시대에 접어들었다. 데이터라는 개념은 그다지 새로운 개념이 아니지만, 언제부터인가 '빅데이터'라는 새로운 용어가 등장하며 많은 사람들의 관심을 받게 되었다. 이런 변화가 생긴 배경은 무엇일까?오늘날의 빅데이터는 과거의 데이터와 차이가 있다. 빅데이터와 데이터의 차이점은 바로 데이터의 양, 빠른 생성 속도와 다양성 등에 있다고 할 수 있다. 과거에는 데이터를 사람이 일일이 기록하는 방식으로 수집이 되었지만 이제는 디지털 환경이 스스로 기록하고 자동으로 수집하는 것이다. 이처럼 다양한 분야에서 수많은 종류의 데이터가 엄청난 속도로 쌓이면서 '빅데이터'가 등장하게 되었다.
2. 빅데이터의 정의
2.1. 빅데이터의 개념
빅데이터의 개념은 디지털 환경에서 만들어지는 데이터로 그 규모가 매우 방대하며, 생성 주기가 짧고, 형태와 수치 데이터만 아니라 문자와 영상 데이터까지 포함하는 대규모의 데이터를 말한다. 즉, 현대 사회에서 다양한 분야에서 생산되고 있는 디지털 데이터의 양이 폭발적으로 증가하고 있으며, 이러한 데이터에는 단순한 수치 데이터뿐만 아니라 문자, 영상, 음성 등 비정형 데이터가 포함되어 있기 때문에 과거 전통적인 데이터 관리 및 분석 기술로는 한계가 있다는 것을 의미한다. 따라서 빅데이터는 단순히 데이터의 양이 방대하다는 것뿐만 아니라 다양성과 신속성 등의 특징을 내포하고 있다고 볼 수 있다."
2.2. 구조화 데이터와 비구조화 데이터
구조화 데이터는 관계형 데이터베이스에 저장되어 있어 데이터 형식이 정규화되어 있고 데이터 스키마가 지원되는 데이터를 의미한다. 구조화 데이터의 장점은 데이터 간 연계성을 기반으로 다양한 데이터 조합을 만들어 데이터 정렬과 분석을 쉽고 빠르게 할 수 있다는 점이다.
반면 비구조화 데이터는 일반 텍스트 기반의 데이터로 분석이 가능한 데이터이다. 텍스트화되지 않은 데이터로는 이미지 파일과 동영상과 같은 멀티미디어 데이터가 있다. 현재 빅데이터 분야에서는 데이터 구조화를 위해 센서 데이터, 웹로그 파일, 클릭 스트림, 소셜 네트워킹 피드 등 원시데이터를 다양한 방식으로 전환하고자 한다. 이를 통해 데이터의 다양한 형식을 수용하는 패러다임의 전환이 일어나고 있다.
3. 빅데이터의 특징
3.1. 빅데이터의 4가지 특징
3.1.1. 다양성
빅데이터의 특징 중 하나인 "다양성"은 빅데이터가 기존의 정형데이터뿐만 아니라 비정형데이터를 포함하고 있다는 것을 의미한다. 빅...
참고 자료
이재홍, 『4차 산업혁명 시대 대한민국의 기회』, 메디치미디어, 2017
이지영, 『용어로 보는 IT』, 블로터, 2013
조성준 외, 『빅데이터 커리어 가이드북』, 길벗, 2021
정용찬, 『빅데이터』, 커뮤니케이션북스, 2013
정용찬, 『빅데이터 혁명과 미디어 정책 이슈』(KISDI Premium Report 12-02), 정보통신정책연구원, 2012
정우진, 『빅데이터를 말하다』, 클라우드북스, 2013
최홍규, 『소셜 빅데이터 마이닝을 활용한 미디어 분석 방법』, 클라우드북스, 2017
Chapman, Pete et al.(2000년) CRISP-DM 1.0 Step-by-step data mining guide. SPSS.
정용찬, 『빅데이터 혁명과 미디어 정책이슈』, 2012
방송통신위원회, 『스마트워크 활성화 추진계획』, 2011
시로타 마코토, 빅데이터의 충격, 한빛미디어, 2013
김권현, R로 하는 빅데이터 분석, 숨은원리, 2020