총 89개
-
빅데이터의 기술 요건 네 단계에 대해 설명하세요2025.01.181. 데이터 수집 이 단계는 기업 내부와 외부에서 발생하는 엄청난 양의 데이터를 모으는 과정을 말한다. 이 과정에서는 다양한 데이터 소스로부터 필요한 정보를 수동이나 자동으로 수집하는 기술이 필요하다. 예를 들어, 기업 내부 데이터는 ETL(Extraction, Transformation, Load) 솔루션을 통해 추출, 변환, 적재하는 방식으로 확보할 수 있으며, EII(Enterprise Information Integration)를 활용하여 데이터를 통합하고 분석할 수 있다. 외부 데이터의 경우, 웹 크롤링 엔진을 사용하여 인...2025.01.18
-
중앙대 트렌드를 읽는 데이터 경영(트읽경) a+ 중간과제 - 데이터 리터러시 프로젝트2025.01.201. 데이터 리터러시 데이터 리터러시는 데이터를 이해하고 활용할 수 있는 능력을 의미합니다. 이 프로젝트에서는 데이터 리터러시 향상을 위한 다양한 활동이 이루어졌을 것으로 보입니다. 데이터 분석, 시각화, 해석 등의 기술을 익히고 실제 데이터를 활용하여 의미 있는 통찰을 도출하는 과정이 포함되었을 것 같습니다. 2. 데이터 경영 데이터 경영은 데이터를 활용하여 기업의 의사결정과 전략 수립을 지원하는 것을 의미합니다. 이 프로젝트에서는 데이터를 활용하여 경영 문제를 해결하고자 하는 시도가 있었을 것으로 보입니다. 데이터 분석 기법을 ...2025.01.20
-
다중 선형 회귀 (Multiple Linear Regression, MLR)2025.05.091. 다중 선형 회귀 (Multiple Linear Regression, MLR) 다중 선형 회귀(Multiple Linear Regression, MLR)는 하나의 종속 변수를 다수의 독립 변수와의 선형 관계로 설명하는 모델입니다. 단순 선형 회귀가 하나의 독립 변수와 하나의 종속 변수 간의 선형 관계를 모델링하는 것과 달리, MLR은 여러 개의 독립 변수가 종속 변수와의 선형 관계에 영향을 미칠 수 있는 경우를 다룹니다. 예를 들어, 주택 가격을 예측하기 위해 주택의 크기, 방의 개수, 위치, 건물 연식 등 여러 독립 변수들을 ...2025.05.09
-
데이터로부터 분포 추정하기2025.05.091. 분포 추정 데이터 분석에서 가장 기본적인 작업 중 하나는 주어진 데이터로부터 분포를 추정하는 것입니다. 분포 추정은 데이터의 특성과 패턴을 이해하고, 통계적 추론과 예측을 위한 기반을 마련하는 핵심 과정입니다. 분포 추정은 주로 확률분포를 가정하고 해당 분포의 파라미터를 추정하는 과정으로 수행되지만, 때로는 데이터가 정규분포나 다른 특정한 분포를 따르지 않는 경우도 있습니다. 이럴 때는 비모수적인 방법이나 시각적인 평가를 통해 분포를 추정하는 것이 필요합니다. 2. 비모수적 방법 비모수적 방법은 통계학에서 사용되는 개념으로, ...2025.05.09
-
머신러닝에서의 차원축소2025.05.101. 차원 축소 차원 축소는 고차원 데이터를 저차원으로 변환하는 과정으로, 데이터의 복잡성을 줄이고 특징을 추출하거나 시각화하기 위해 사용됩니다. 주요 방법으로는 특징 선택과 특징 추출이 있으며, 차원 축소의 이점은 데이터 시각화, 계산 효율성 향상, 잡음 제거 등입니다. 2. 차원의 개념 차원은 데이터를 표현하기 위해 필요한 축의 수를 의미하며, 각 차원은 데이터의 특정 특성을 나타내는 변수 또는 속성이 됩니다. 차원이 높을수록 데이터의 복잡성과 계산 비용이 증가하므로 차원 축소가 필요합니다. 3. 특징(feature)의 개념 특...2025.05.10
-
뉴스(인터넷, TV, 신문 등)에 데이터 시각화가 쓰인 사례 분석2025.01.131. 데이터 시각화의 중요성 데이터 시각화는 복잡한 데이터를 쉽게 이해할 수 있도록 변환하는 핵심적인 과정이다. 이는 단순히 숫자나 텍스트의 나열이 아닌, 시각적 매체를 통해 정보를 전달함으로써, 이해 관계자들이 보다 신속하고 정확하게 데이터를 해석하고 필요한 조치를 취할 수 있도록 돕는다. 2. 뉴스 매체의 데이터 시각화 활용 현대의 뉴스 매체들은 이러한 시각화 기법을 활용하여 복잡한 사회, 경제, 정치적 현상을 설명하고, 때로는 이를 통해 독자들의 의견 형성에 영향을 미치기도 한다. 3. 제주도 대중교통 데이터 시각화 사례 제주...2025.01.13
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터시각화2025.01.251. 좋은 데이터 시각화의 사례 위 사례는 복잡한 실시간 기상 정보를 시각적으로 매력적이고 직관적인 형식으로 전달함으로써 탁월한 정보 전달력을 보여주는 데이터 시각화이다. 막대한 양의 원시 데이터를 동적인 대화형 디스플레이로 변환함으로써 지도를 통해 사용자는 전 세계 바람의 흐름, 바다의 파도 특성, 이산화탄소 농도, 미세입자 등의 상태를 더 잘 이해할 수 있다. 이는 Mode에서 Air, Ocean, Chem 등을 선택하여 거의 실시간으로 확인할 수 있다. 아울러 확대 및 축소를 통해 특정 지역에 초점을 맞추어 파악할 수도 있다....2025.01.25
-
방통대 [데이터시각화] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 워드 클라우드 워드 클라우드는 텍스트 데이터에서 단어의 빈도 수가 높을수록 큰 글씨로 표현하는 시각화 기법이다. 주제나 핵심 키워드를 쉽고 효과적으로 전달할 수 있다는 장점이 있다. SNS 데이터에서 인기 키워드를 찾거나 연설문에서 핵심 내용과 주제를 찾는데 유용하게 사용될 수 있다. 또한 온라인 게시글에서 여론을 찾아내기도 하며 고객 리뷰에 대한 요약을 제공하기도 한다. 특히나 미국 대선 때 사용되는 워드 클라우드에서는 각 후보자의 핵심 공약이나 정책 방향, 이슈, 유권자들이 중요하게 생각하는 가치관을 직관적으로 확인할 수 ...2025.01.25
-
빅데이터의 이해와 활용2025.01.251. 데이터과학자 데이터 과학자는 기계학습, 데이터 시각화, 통계 분석 등의 지식을 바탕으로 방대한 양의 데이터에서 일정한 패턴을 발견하고, 그를 통해서 인사이트를 얻어 내는 역할을 수행한다. 또한 데이터 과학자들은 복잡한 빅데이터 분석을 통해 추출한 인사이트로 다양한 비즈니스 의사 결정을 내린다. 작업 중인 데이터를 이해하며, 데이터를 정제하고, 처음부터 제대로 된 데이터가 입력될 수 있도록 데이터를 전처리하며 예측을 위한 모델을 구축하게 된다. 데이터 과학자들은 인공지능 지식과 활용 능력을 갖추어야 하며, 기계학습 알고리즘에 대...2025.01.25
