1. 검색엔진소개1.1 NAVER기본검색기법- 불리언탐색 (AND, OR, NOT)AND: 연산자[ + ]정보 +검색으로 검색했을 때 : ‘정보’에 대한 검색결과 중 ‘검색’을 포함한 상세검색 결과를제공.정보 + 검색으로 검색했을 때 : 정보검색에 대한 일반 검색결과를 제공.OR:연산자[ | ]정보 | 검색으로 검색했을 때: ‘정보 검색’을 하나이상 포함한 상세검색 결과를 제공.NOT:연산자 [ - ]정보 - 검색으로 검색했을 때: ‘정보’에 대한 검색결과중 ‘ 검색’을 제외한 상세검색결과를 제공.* NAVER에서 불리언연산자입력 후 공백의 여부에 따라 검색의 성공여부도 달라지므로AND와 NOT의 경우, 연산자입력 후 공백을 주지않고 OR의 경우, 연산자입력후 공백을 준다.- 대소문자구별: NAVER는 대소문자를 구별하지않고 검색결과를 제공.-절단 : NAVER는 절단탐색을 지원하지 않음.(‘정보’로 검색했을 때와 ‘정보**’로 검색했을 때 결과가 같음.)- 인접탐색 : NAVER는 인접탐색(WITH, NEAR)을 지원하지 않음.WITHNEAR- 필드탐색 : 필드탐색을 지원하는 것처럼 보이지만 자료유형에 따라 분류해 놓은 것임.고급검색- 퍼지탐색: 질의입력 시 만들어진 에러를 수용하고 올바른 질의어를 입력할 수 있도록제안함.- 가중치탐색: 정보, 3, +, 검색, 5이 모두 검색되는 것을 보아 지원하지 않음.- 질의확장: 질의어와 연관 된검색어를 지원하는 것을 보아 지원함.1.2DAUM기본검색기법- 불리언탐색 (AND, OR, NOT)AND: 연산자[ + ]정보 +검색으로 검색했을 때 : ‘정보’에 대한 검색결과 중 ‘검색’을 포함한 상세검색 결과를제공.OR: 연산자 [ | ]정보 | 검색으로 검색했을 때: ‘정보 검색’을 하나이상 포함한 상세검색 결과를 제공.NOT: 연산자 [ - ]정보 - 검색으로 검색했을 때: ‘정보’에 대한 검색결과중 ‘ 검색’을 제외한 상세검색결과를 제공.* DAUM의 경우 모든 연산자입력 후 공백을 주지 않아야 검색에 성공할 수 있다.- 대소문자의 구별 : DAUM의 경우 대소문자를 구별하지않고 검색결과를 제공.- 절단 : DAUM은 절단탐색을 지원하지 않음.(‘정보’로 검색했을 때와 ‘정보**’으로 검색했을 때 아래와 같이 결과가 같음.)- 인접탐색 : DAUM은 인접탐색(WITH, NEAR)을 지원하지 않음.WITHNEAR- 필드탐색 : 필드탐색을 지원하는 것처럼 보이지만 자료유형에 따라 분류해 놓은 것임.고급검색- 퍼지탐색: 질의입력 시 만들어진 에러를 수용하고 올바른 질의어를 입력할 수 있도록제안함.- 가중치탐색: 정보, 3, +, 검색, 5이 모두 검색되는 것을 보아 지원하지 않음.- 질의확장: 질의어와 연관 된검색어를 지원하는 것을 보아 지원함.표1. NAVER와 DAUM 에서 지원하는 검색기법.NAVERDAUM기본검색불리언지원함.AND[+], OR[ | ], NOT [ - ]대소문자의 구별지원하지않음.절단지원하지않음.인접지원하지않음.필드지원하지않음.고급검색퍼지지원함.(이것을 찾으시나요?)가중치지원하지않음.질의확장지원함.(연관검색어)* NAVER와 DAUM은 불리언, 퍼지, 질의확장 세 가지의 검색기법을 지원하고 있다.2. 질의어 구성 및 선정근거2.1 질의어 구성-질의어 : 키워드 3개로 이루어진 명사구.온라인정보서비스 (온라인 + 정보 + 서비스)인터넷정보검색 (인터넷 + 정보 + 검색)정보통신보안 (정보 + 통신 + 보안)2.2선정과정필요한 정보에 대한 개념 3가지를 선정한다.개념을 키워드로 전환한다.키워드를 조합하여 질의어로 선정한다.예시))2.3 선정근거정확하고 분명한 적합성판단을 위해 질의어를 선정함에 있어 전문적인 지식에 관련 된키워드를 선정하였다.세 개의 질의어에 모두 ‘정보’를 포함시킴으로써 정보에 관련된 자료를 찾고자하였다.찾고자하는 정보의 개념과 키워드가 일치하도록하여 질의어를 선정하는데 어려움이 없도록하였다. (예, 온라인에서제공하는 정보서비스 => 온라인정보서비스)3.적합문헌평가기준온라인정보서비스각종 온라인정보서비스사이트는 제외하고 온라인정보서비스에 대한 정의, 개념 등1차정보원으로 한정함.인터넷정보검색인터넷정보검색에 대한 행사, 자격증 등을 제외한 전문정보로 한정함.정보통신보안정보통신보안에 대한 개념, 방법 등에 대한 일차정보원으로 한정.4. 검색성능평가결과정확률계산법 ( 검색된 적합문헌수 / 검색된 문헌총수 )평균정확률계산법 ( 더한 정확률 / 더한 정확률 개수)4.1 NAVER- 온라인정보서비스P@10 : 2/10 = 0.2P@30 : 2/30 = 0.07- 인터넷정보검색P@10 :2/10 = 0.2P@30 :3/30 = 0.1- 정보통신보안P@10 : 0/10 = 0P@30 : 2/30 = 0.074.2DAUM- 온라인정보서비스P@10 :0/10 = 0P@30 :3/30 = 0.1- 인터넷정보검색P@10 : 4/10 = 0.4P@30 : 4/30 = 0.13- 정보통신보안P@10 : 1/10 = 0.1P@30 : 4/30 = 0.134.3 평균정확률- 검색엔진별NAVER :0.1DAUM :0.14- 검색엔진 내 질의 별 평균정확률NAVER온라인정보서비스 : 0.14인터넷정보검색 :0.15정보통신보안 :0.04DAUM온라인정보서비스 :0.05인터넷정보검색 :0.28정보통신보안 :0.12- 전체 질의별 평균정확률온라인정보서비스 : 0.09인터넷정보검색 : 0.21정보통신보안 : 0.08표2. 질의 별, 검색엔진 별 평균정확률검색엔진질의어NAVERDAUM각 질의별평균정확률온라인정보서비스0.130.050.09인터넷정보검색0.150.280.21정보통신보안0.040.120.07검색엔진 별평균정확률0.160.155. 결론2개의 검색엔진(NAVER,DAUM)을 대상으로 검색실험을 한 결과,상대적으로 높은정확률을 갖는 검색엔진은 DAUM이다.(NAVER = 0.1, DAUM = 0.14)3개의 질의어 중 2개의 질의어 검색에서 상당한 차이로 DAUM의 결과가 높은 정확률을 보였고, 1개의 질의어 검색에서 NAVER가 상당한 차이로 높은 정확률을 보였다.검색엔진의 정확률이 떨어지는 원인으로는 중복된 검색결과를 들 수 있다.2개의 검색엔진에서 3개의 질의어를 검색했을 때 모두 적합하지않은1개이상의 중복된 검색결과를 보여주었다.가장높은 평균정확률을 보인 질의어는 인터넷정보검색이다.두개의 절단지점에 따른 정확률의 결과는 P@10>P@30 이다.NAVER =>P@10 : 0.4/ P@30 : 0.24 , DAUM=> P@10 : 0.5 /P@30 : 0.366. 느낀점몇 주전 검색엔진의 검색기법 분석이라는 과제를 주셨을 때만해도 이번과제가 이렇게 어려울 줄은 몰랐다. 단순히 두개의 검색엔진에서 수업시간에 배운 검색기법 실험만하면 된다고 생각했기 때문에 조급하지 않았던 것같다. 그런데 역시 과제는 시작하고 나면 할 것이 많아지고 어려워진다는 것을 다시한번 깨달았다. 검색엔진에서 지원하는 검색기법을 정확하게 조사해야하기 때문에 같은 기법을 질의어를 몇번이고 변형해서 검색해보는 일이 쉽지만은 않았다.그리고 검색실험을 진행하면서 질의어 검색결과에 대한 정확률을 측정하는 것은 수월했지만검색엔진 내에서의 질의유형별 평균을 산출할 때에는 검색문헌 총 수의 절단지점 두개 중 어떤것을 기준으로 해야하는 지 몰라서 굉장히 어려움을 겪었다.이번 과제를 수행하면서 느낀점이 있다면 “어떤질의어를 입력하느냐, 어떤 검색엔진에서 하느냐에 따라 검색결과만족도에서 상당한 차이를 느낄 수 있겠구나”라는 것이다. 검색에 대해쉽고 누구나 할 수 있는 것이라고 생각했고, 검색결과의 면에서도 별다른 차이가 없을 것이라고 생각했던 이때까지의 나의 생각을 전환시켜주는 계기가 되었다.마지막으로 과제를 받았을 때에는 검색엔진도 최소한으로, 질의어도 최소한으로하고싶었던 것이 사실이다. 그런데 검색실험을 하고 결과를 보니 일반화하기도 어려울 뿐만아니라 비교하기에도 검색엔진의 수와 질의어의 수가 너무 적어서 이 결과를 가지고 보고서를 써도 되는 것인가 걱정이 될 정도였다.실습을 통해 배운 것을 한번더 생각하고 책도 한번더 볼 수있었고, 스스로 실험하고 결과를 얻어서 분석할 수 있다는 것이 어떠한 과제보다 흥미로웠다.검색시스템성능평가과제학교 : 서울여자대학교학과 : 문헌정보학과학번 : 20110611이름 : 변 슬 기목차검색엔진소개NAVERDAUM질의어 구성 및 선정근거질의어 구성선정과정선정근거적합문헌평가기준검색성능평가결과NAVERDAUM결론느낀점