자연어 처리를 통한 학술논문 처리 방법
2025.11.16
1. 자연어처리(NLP)
자연어처리는 일상생활에서 사용되는 자연어를 기계가 이해할 수 있도록 처리하는 것으로, 컴퓨터가 자연어를 이해하고 출력하도록 하는 처리 과정을 의미한다. 본 연구에서는 Python의 KoNLPy 라이브러리를 활용하여 한글 형태소 분석을 수행했으며, 꼬꼬마, 한나눔, 코모란, Okt 등 다양한 형태소 분석기를 비교 검토하여 한나눔 형태소 분석기의 정확성이 가장 높다고 판단했다.
2. 웹 크롤링 및 텍스트 추출
Google Colab 환경에서 BeautifulSoup 라이브러리를 이용하여 KCI 등재 논문 사이트...
2025.11.16