총 20개
-
R 언어를 이용한 데이터 크롤링 및 가공2025.04.261. R 언어 R 언어는 통계 및 데이터 분석을 위한 강력한 프로그래밍 언어입니다. R 언어를 이용하여 데이터 크롤링, 전처리, 시각화 등 다양한 작업을 수행할 수 있습니다. R 스튜디오는 R 언어를 사용하기 위한 대표적인 IDE로, 기본적인 통계 및 시각화 기능을 제공하며 다양한 패키지를 통해 복잡한 데이터 분석도 가능합니다. 2. 데이터 크롤링 데이터 크롤링은 웹 상의 데이터를 자동으로 수집하는 기술입니다. R 언어의 twitteR 패키지를 이용하면 트위터 데이터를 크롤링할 수 있습니다. 이를 통해 트위터 데이터를 수집하고 전처...2025.04.26
-
계절학기 수강신청 추천 프로그램 개발2025.11.171. 데이터 전처리 및 크롤링 BeautifulSoup과 Pandas 라이브러리를 활용하여 웹페이지에서 계절학기 교과목, 학사일정, 공지사항 데이터를 수집하고 정제했습니다. urllib를 이용한 정적 웹페이지 크롤링, HTML 파싱을 통해 필요한 정보를 추출하고, 결측값 처리 및 데이터 가공을 수행했습니다. CSV 형식의 교과목 데이터와 HTML 형식의 학사일정 데이터를 통합하여 분석 가능한 형태로 변환했습니다. 2. 프로그램 알고리즘 및 함수 설계 학생 정보 입력을 통해 전공/일선/교양 구분을 수행하고, 관심 분야 입력에 따라 과...2025.11.17
-
자연어 처리를 통한 학술논문 처리 방법2025.11.161. 자연어처리(NLP) 자연어처리는 일상생활에서 사용되는 자연어를 기계가 이해할 수 있도록 처리하는 것으로, 컴퓨터가 자연어를 이해하고 출력하도록 하는 처리 과정을 의미한다. 본 연구에서는 Python의 KoNLPy 라이브러리를 활용하여 한글 형태소 분석을 수행했으며, 꼬꼬마, 한나눔, 코모란, Okt 등 다양한 형태소 분석기를 비교 검토하여 한나눔 형태소 분석기의 정확성이 가장 높다고 판단했다. 2. 웹 크롤링 및 텍스트 추출 Google Colab 환경에서 BeautifulSoup 라이브러리를 이용하여 KCI 등재 논문 사이트...2025.11.16
-
마이크로 모빌리티 서비스 제공 기업의 수요 예측 및 전략적 배치2025.01.171. 수요 예측 방법론 수요 예측을 위해 시계열 분석과 머신 러닝 알고리즘을 활용할 수 있다. 시계열 분석은 과거 패턴을 바탕으로 미래를 예측하는 방법이며, 머신 러닝은 복잡한 데이터에서 패턴을 학습하여 예측하는 방법이다. 각각의 장단점이 있으므로, 상황에 따라 적절한 방법을 선택해야 한다. 2. 필요한 데이터 유형 및 수집 방법 수요 예측을 위해 필요한 데이터에는 이용 기록 데이터, 고객 프로필 데이터, 외부 환경 데이터가 있다. 이용 기록 데이터는 서비스 애플리케이션에서, 고객 프로필 데이터는 데이터베이스에서, 외부 환경 데이터...2025.01.17
-
장원사이버교육원 컴퓨터공학 토론 과제,전체 A+, 평균 8.5/10점(자료구조, 컴퓨터구조 과목)2025.01.231. 그래프 자료구조 인접행렬과 인접리스트는 그래프의 정점과 간선 표현을 보기 쉽게 만든다. 인접행렬은 간선 존재 여부를 빠르게 판단할 수 있지만 메모리 공간을 많이 차지하고 간선 탐색 시간이 오래 걸린다는 단점이 있다. 인접리스트는 메모리 공간이 작고 간선 탐색 시간이 적게 걸리는 장점이 있어 희소그래프 환경에서 유리하다. 대부분의 그래프가 희소그래프이고 데이터가 많은 현대에는 인접리스트가 더 효율적일 것이라고 생각한다. 2. CPU 성능 향상 CPU의 성능을 향상시키기 위해 초기에는 클록 주파수를 높였지만 발열과 전력 등의 한계...2025.01.23
-
국내외 광고의 성공 또는 실패사례2025.01.051. 지그재그의 광고 전략 지그재그는 크롤링 기술을 이용하여 여성 쇼핑몰 데이터를 수집하고, 바이럴 마케팅, 연합 앱 페이스북 광고, 윤여정 배우를 통한 브랜드 캠페인 등 다양한 방법으로 고객을 확보하였다. 또한 앱 내 다양한 장치로 고객 활성화를 도모하고, 개인 맞춤형 알고리즘과 통합 결제 시스템 'Z결제'를 통해 고객 리텐션 전략을 수립하였다. 이러한 노력으로 지그재그는 성공적인 성장을 이루었고, 최근 카카오에 인수되었다. 1. 지그재그의 광고 전략 지그재그는 온라인 쇼핑몰 플랫폼으로, 다양한 광고 전략을 통해 효과적으로 고객을...2025.01.05
-
빅데이터와 인공지능의 발전이 기업에 미치는 영향2025.01.031. 빅데이터의 개념 빅데이터는 기존의 데이터베이스 시스템으로는 다루기 어려운 대규모의 비정형화된 데이터를 수집, 저장, 분석하는 기술을 의미합니다. 빅데이터의 특징은 '3V'로 알려져 있는데, 이는 Volume(양), Variety(다양성), Velocity(속도)를 나타냅니다. 빅데이터는 정형 데이터, 비정형 데이터, 반정형 데이터 등 다양한 종류의 데이터를 포함하며, 웹 크롤링, 센서 데이터 수집, 소셜 미디어 데이터 수집 등의 방법으로 수집됩니다. 2. 빅데이터를 활용한 기업 사례 페이스북과 아마존은 빅데이터를 활용하여 성공...2025.01.03
-
파이썬을 이용한 불법 사이트 탐지 및 차단2025.04.281. 불법 사이트 탐지 이 프로젝트는 파이썬을 사용하여 불법 사이트를 탐지하고 차단하는 기능을 제공합니다. 주요 기능으로는 구글 검색을 통해 불법 사이트 URL을 추출하고, 이를 hosts 파일에 차단하는 것입니다. 또한 머신러닝 기술을 활용하여 URL의 악성 여부를 판단하고, meta 태그의 키워드 필터링을 통해 유해 사이트를 탐지하는 기능을 포함하고 있습니다. 2. 구글 검색 및 URL 추출 이 프로젝트는 구글 검색을 통해 불법 사이트 URL을 추출하는 기능을 제공합니다. 특정 키워드로 구글 검색을 수행하고, 검색 결과에서 불법...2025.04.28
-
빅데이터의 기술 요건 네 단계에 대해 설명하세요2025.01.181. 데이터 수집 이 단계는 기업 내부와 외부에서 발생하는 엄청난 양의 데이터를 모으는 과정을 말한다. 이 과정에서는 다양한 데이터 소스로부터 필요한 정보를 수동이나 자동으로 수집하는 기술이 필요하다. 예를 들어, 기업 내부 데이터는 ETL(Extraction, Transformation, Load) 솔루션을 통해 추출, 변환, 적재하는 방식으로 확보할 수 있으며, EII(Enterprise Information Integration)를 활용하여 데이터를 통합하고 분석할 수 있다. 외부 데이터의 경우, 웹 크롤링 엔진을 사용하여 인...2025.01.18
-
4차 산업혁명과 관련된 정보기술인 빅데이터에 대한 개념과 특성, 활용 사례 및 문제점2025.01.171. 빅데이터의 개념과 특성 빅데이터는 기존의 관리 및 분석 시스템으로는 다루기 어려운 거대한 양의 데이터 집합을 의미하며, 데이터의 증가량, 다양성 및 처리 속도와 같은 세 가지 'V'로 특성을 요약할 수 있다. 또한 데이터의 변동성과 복잡성도 빅데이터의 특징 중 하나로 고려될 수 있다. 2. 빅데이터를 활용한 기술 빅데이터 기술에는 데이터를 저장하고 수집하며 공유하고 분석하고 검색하고 시각화하는데 필요한 다양한 기술과 도구가 포함되어 있다. 이를 통해 대규모 다양한 종류의 데이터를 저비용으로 처리하여 정보를 추출하고 예측을 가능...2025.01.17
