총 4,066개
-
데이터 마이닝, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 데이터 마이닝 기법 데이터 마이닝은 데이터에서 의미를 추출하는 기법을 의미하며, 모수적 모형 접근 방법과 알고리즘 접근 방법이 모두 활용될 수 있다. 모수적 모형 접근법은 모형을 설정하고 모수를 추정하는 방식이며, 알고리즘 접근법은 정해진 알고리즘으로 계산하여 결과를 분석하는 방식이다. 각각의 장단점이 있으며, SNS 텍스트 데이터 분석에 활용할 수 있다. 2. 로지스틱 회귀모형 적합 와인 품질 데이터에 로지스틱 회귀모형을 적합하였다. alcohol 변수만 사용한 모형, sulphates 변수만 사용한 모형, 그리고 유의미한 ...2025.01.25
-
국내 빅데이터 활용 사례2025.11.141. 금융 분야 빅데이터 활용 금융 산업에서 빅데이터는 알고리즘 트레이딩, 시장 예측, 신용평가, 이상 거래 탐지, 고객 마케팅, 업무 자동화 등 다양한 분야에 활용되고 있다. 신한카드는 카드 소비 빅데이터를 활용한 경기동향 파악 컨설팅을 제공하고, 국민카드는 데이터루트 플랫폼을 제공하며, 증권사들은 AI 데이터 분석 서비스를 출시하고 있다. 금융기관들은 빅데이터와 AI를 활용한 지속적인 업무 자동화 사업을 발굴하고 있으며, 대출 상담, 연말정산 안내, 기업여신 자동심사 등에 적용하고 있다. 2. 교통 분야 빅데이터 활용 경찰청은 ...2025.11.14
-
자료에 극단값이 포함된 경우 극단값은 반드시 제외해야 하는지, 그렇게 생각하는 이유를 논거하시오.2025.01.271. 극단값이 데이터 분석에 미치는 영향 극단값은 데이터의 중심 경향 및 분포를 왜곡하는 주요 요소로 작용한다. 특히 평균, 표준편차 등 중심화된 통계치를 이용해 데이터 분석을 수행할 경우, 극단값이 포함됨으로써 분석 결과가 실제와 다르게 나타날 수 있다. 또한 극단값은 예측 모델의 성능에 부정적인 영향을 미칠 수 있다. 2. 극단값을 제외해야 하는 상황 극단값을 제외하는 것이 바람직한 경우는 해당 극단값이 데이터의 오류이거나 분석의 목적에 부합하지 않는 경우이다. 또한 극단값이 데이터의 분포나 경향성을 과도하게 왜곡할 경우 이를 ...2025.01.27
-
데이터마이닝의 정의와 활용 분야2025.01.181. 데이터마이닝의 정의 데이터마이닝은 대규모 데이터 세트에서 통계적이고 수학적인 기법을 활용하여 유용한 정보와 패턴을 추출하는 과정을 말한다. 이는 데이터베이스, 데이터 웨어하우스 또는 다양한 데이터 소스로부터 데이터를 수집하고 분석함으로써 이루어진다. 데이터마이닝은 기계 학습, 통계 분석, 패턴 인식, 인공지능 등의 다양한 분야의 기법과 원칙을 포괄하는 다중 학문적인 접근 방법을 사용한다. 2. 데이터마이닝 활용 분야: 상업 분야 온라인 소매업체는 고객의 구매 이력, 검색 기록, 선호도 등을 분석하여 개별 고객에게 맞춤형 제안을...2025.01.18
-
유전체 분석에서의 인공지능 - 개인 맞춤형 의료를 위한 방대한 유전체 데이터 분석2025.05.111. AI 기반 유전체 분석의 개념과 의의 유전체 데이터의 증가로 인해 전통적인 분석 방법의 한계가 드러나고 있으며, 이를 해결하기 위해 AI가 도입되고 있습니다. AI 기반 유전체 분석은 개인의 유전체 정보를 활용하여 개인 맞춤형 의료 서비스를 제공할 수 있는 기반을 마련합니다. 2. AI 기반 유전체 분석의 응용 분야 AI 기반 유전체 분석은 유전자 변이와 질환과의 관련성을 파악하여 질환 예측과 예방에 기여하며, 유전체 데이터를 기반으로 약물 반응을 예측하여 개인에게 최적의 치료법을 제시합니다. 3. AI 기반 유전체 분석의 장...2025.05.11
-
회귀분석을 통한 주택 가격 예측2025.01.161. 회귀분석의 개념 회귀분석은 독립 변수와 종속 변수 간의 관계를 수학적으로 표현하는 방법입니다. 단순 회귀분석은 하나의 독립 변수와 하나의 종속 변수 간의 관계를 분석하고, 다중 회귀분석은 여러 개의 독립 변수를 사용하여 종속 변수를 예측합니다. 회귀분석은 경제학, 의학, 사회과학 등 다양한 분야에서 활용되며, R제곱 값과 잔차 분석을 통해 모델의 성능을 평가할 수 있습니다. 2. 회귀분석의 중요성 회귀분석은 다양한 분야에서 중요한 역할을 합니다. 경제학에서는 소비자 행동 예측과 시장 트렌드 분석에 사용되며, 의학에서는 환자 회...2025.01.16
-
비즈니스 인텔리전스의 핵심 기술: 빅데이터와 AI2025.11.161. 빅데이터 분석 빅데이터 분석은 대량의 데이터를 수집, 전처리, 분석, 시각화하여 패턴과 통찰력을 도출하는 기술입니다. 장점으로는 대용량 데이터 처리 가능성과 예측력 향상이 있으며, 단점으로는 보안 문제가 있습니다. 마케팅, 금융, 제조 등 다양한 산업에서 활용되며, 비즈니스 의사결정의 정확성과 효율성을 향상시키는 기대효과를 제공합니다. 2. 인공지능(AI) 기술 인공지능은 기계가 사람과 같이 학습하고 추론하는 기술로, 머신러닝, 딥러닝, 강화학습 등의 알고리즘을 활용합니다. 자동화 가능성, 예측력 향상, 인간의 한계 극복이 주...2025.11.16
-
4차 산업혁명과 빅데이터 전략2025.05.051. 4차 산업혁명 4차 산업혁명은 현존하는 기술과 응용 기술이 '융합'하여 상품화되고 새로운 기술이 트렌드를 선도하는 것이며, '로봇자동화'와 '인공지능'이 기반 기술로 정의될 수 있다. 로봇자동화는 외부 환경의 정보를 수집하는 다양한 감각 수집 기관의 발전으로, 인공지능은 주변 데이터를 수집하여 산술적으로 가장 높은 결론에 도출하는 방법으로 인간과 비슷하게 행동하고 판단하게 될 것이다. 이러한 기술들은 단순히 휴머로이드로 국한되는 것이 아니라 기술 혁신을 통하여 시간의 경과에 따라 스스로 더 많은 경험 데이터를 축척하여 인간과는...2025.05.05
-
빅데이터 활용 사례와 기업 발전 방향2025.01.041. 빅데이터 정의 이 논문은 빅데이터의 정의를 시작으로 하여 실제 활용 사례인 아마존의 예측배송시스템과 월마트의 데이터 사용을 통해 대한민국 기업의 발전 방향을 제시하고자 한다. 2. 아마존의 예측배송시스템 아마존은 빅데이터를 활용하여 예측배송시스템을 구축하였다. 이를 위해서는 소비자가 주문하기 전에 예상되는 물류 거점에 필요한 제품을 배치하고, 최종 목적지로 최적화된 경로에 따라 배송이 이루어져야 한다. 3. 월마트의 데이터 활용 월마트는 빅데이터를 활용하여 고객 행동 분석, 재고 관리, 공급망 최적화 등 다양한 분야에서 데이터...2025.01.04
-
랜덤 포레스트 (Random Forest Algorithm)2025.05.091. 랜덤 포레스트 (Random Forest Algorithm) 랜덤 포레스트는 특이하고 재미있는 방법론으로, 앙상블 학습(Ensemble Learning)의 한 종류입니다. 앙상블 학습은 여러 개별적인 학습 모델을 조합하여 보다 강력하고 정확한 예측 모델을 구축하는 기법입니다. Random Forest는 이러한 개별 모델로 결정 트리(Decision Tree)를 사용합니다. 하지만 단일 결정 트리를 사용하는 것이 아니라 수백 또는 수천 개의 결정 트리를 생성하고 이들을 조합하여 학습하고 예측을 수행하며, 이들을 결합하여 보다 정...2025.05.09
