본문내용
1. 서론
1.1. 빅 데이터 정의 및 특징
빅 데이터는 기존 데이터베이스 관리 도구의 능력을 넘어선 대량의 정형 또는 비정형 데이터의 집합이다. 이는 가치를 추출하고 결과를 분석하는 기술이다. 빅 데이터는 양이 매우 많으며, 증가 속도가 매우 빠르고, 종류가 매우 다양한 데이터이다. 현재 빅 데이터가 가진 대표적인 특징은 규모, 속도, 다양성인 3V로 불린다. 그러나 최근에는 값, 정확성, 가변성, 시각화 등이 새로운 V로 등장했다. 빅 데이터는 정치, 사회, 경제, 문화, 과학 기술 등 전 영역에 걸쳐 사회와 인류에게 가치 있는 정보를 제공할 가능성을 제시하고 있다. 하지만 개인정보 침해와 보안 측면에서 문제점도 지적되고 있다. 특히 수많은 개인 정보의 집합소이므로 정보 유출 시 큰 문제가 발생할 수 있다.
1.2. 빅 데이터 시장 현황
오늘날 빅 데이터는 사회 각 방면에서 주목을 받고 있다. 가트너, IDC, EMC와 같은 세계적인 시장 조사기관 10개 중 9개에서 빅 데이터를 2013년 IT 관련 키워드로 선정했다.
데이터의 양과 속도, 다양성이 급격히 증가하면서 각 산업군에서 빅 데이터의 활용이 크게 확대되고 있다. 특히 소셜 네트워크와 모바일 기기의 보급으로 폭발적으로 늘어나는 비정형 데이터에 대한 관심이 높아지고 있다.
IDC는 2012년부터 새롭게 생성되는 데이터가 1.7 Zeta Byte를 넘어섰으며, 향후 더욱 빠른 속도로 증가할 것이라고 예측했다. 이처럼 데이터의 양은 기하급수적으로 늘어나고 있으며, 이를 활용하고자 하는 각 산업군의 요구가 증가하고 있다.
기업들은 소셜 미디어, 모바일 기기 등에서 생성되는 방대한 데이터를 분석하여 새로운 비즈니스 기회를 모색하고 있다. 특히 고객 데이터 분석을 통해 고객 관리 및 마케팅 활동에 활용하는 등 빅 데이터 활용이 급속도로 늘어나고 있는 추세이다.
이와 같이 4차 산업혁명 시대를 주도하는 핵심 기술로 주목받고 있는 빅 데이터 시장은 지속적으로 성장할 것으로 전망된다. 향후 10년 내 현재 빅 데이터 시장을 선점하는 것이 매우 중요해질 것이다.
2. 빅 데이터 기술
2.1. 빅데이터 아키텍처
빅데이터 아키텍처는 기업이 데이터를 관리하고 분석하는 방법의 기본 구조에 대한 청사진을 제공한다. 빅데이터 아키텍처는 데이터 소스, 데이터 저장, 빅데이터 분석, 분석된 결과가 비즈니스 인텔리전스로 제공되는 사용 레이어까지 4개의 기본 "레이어"에 걸쳐 빅데이터 관리에 필요한 프로세스를 매핑해준다.
데이터 소스 레이어는 기업이나 조직에 존재하는 다양한 데이터 소스를 포함한다. 이는 회사 내부 데이터베이스, ERP 시스템, 웹사이트 로그, 센서 데이터 등 정형, 비정형 데이터 모두를 포함한다. 데이터 저장 레이어에서는 방대한 양의 데이터를 효율적으로 저장하고 관리하는 데 필요한 기술이 적용된다. 이에는 데이터 레이크, NoSQL 데이터베이스 등이 포함된다....