Product Recognition● 제품인식(Product Recognition)이란 특정 객체가 DB내 어떤 Product 와 일치하는지를 맞추는 Task로 주로 Retail 분야에서 많이 연구되고 활용되고 있음 (e.g Amazon Go, vivino, Super Swift)● 화해에서는 사용자의 올리브영에서의 활용과 내부 제품 등록 프로세스를 개선하기 위한 목적으로 개발 시작Architecture● 사진 기반 제품인식을 위해서 크게 (1)이미지 유사도, (2)텍스트 유사도 정보를 활용하는 방향으로 설계● 수십 만개의 이미지와의의 빠른 Classification을 위해서는 Query Vector 기반의 Vector Search가 필수적이라고 판단● 즉, 이미지 유사도 관점에서 중요한 Task는 성능이 뛰어난 Visual Embedding Model을 만드는 것Self-Supervised Learning (SSL)● 기존의 Label이 필요한 Supervised Learning의 제약을 극복하기 위한 Unsupervised Learning의 한 영역으로 고안됨
들어가며.모델적인 것보다는 전체 디자인을 중점적으로 이해하는게 좋음(목적, 모델, 서빙 등).오래된 논문(14년전)임에도 아직까지 그 철학과 틀은 유지되어 여전히 현대적이라고 볼 수 있음유저 세그먼테이션.직접 방문(Direct navigation): 유튜브가 아닌 다른 곳에서 발견한 유튜브 영상을 시청.구체적 검색(search and goal-oriented browse): 직접적인 검색을 통해 시청.영상 즐기기(Unarticulated want): 시간 떼우기 위해 그냥 재밌는 영상을 시청목표영상을 즐기는 유저(Unarticulated want)에게 영상을 추천하여 유튜브에서 즐겁게 오래 머무르게 하는 것요구사항.추천되는 비디오 목록이 주기적으로 업데이트되는 것.유저가 최근에 보여준 행동 기록을 참고해서 비디오를 추천해줄 것.사용자에게 다양한 스펙트럼의 비디오들을 추천해주는 것챌린지.유저가 올린 영상은 메타데이터가 너무 없음.비디오 숫자와 유저 숫자가 엄청나게 많고, 대부분의 영상이 10분 이내의 짧은 영상임 (2024년 현재 40억개).유저의 행동데이터가 상대적으로 너무 짧고 노이지 함 (구매,대여 같은 개념이 아님).순간적으로 인기를 타는(viral) 비디오들이 워낙 많아서 추천 목록을 짧은 주기로 갱신이필요
유저는 상품 구매, 커뮤니티 탐색, 정보 획득 등 다양한 목적으로 ㅇㅇㅇ에 접속합니다. 이를 위해 유저는 다양한 기능을 사용 할 수 있지만, 그 중 검색 기능은 대표적인 정보 검색 시스템으로 유저가 작성한 자연어로 정보를 검색을 가능케 하여 많은 편의성을 제공해줍니다. 자연어를 입력 할 수 있는 만큼 다양한 아이템에 대한 결과를 제공해줄 수 있지만, 이번 리포트는 유저가 상품 검색을 목적으로 하는 상황을 전제로 진행해보겠습니다.사용자 유형검색어 유형을 분류하기 전에 검색창에 진입한 유저는 어떤 목적을 가졌는지를 먼저 생각해 보아야 합니다. 유튜브 추천 시스템 논문에 따르면, 유튜브는 유저를 (1)외부링크로 유입된 유저, (2)아주 구체적인 검색을 하는 유저, (3)특별한 검색없이 즐기는 유저와 같은 3가지의 유형으로 구분합니다. 이를 ㅇㅇㅇ 검색창에 진입한 유저에 대응해보면 크게 2가지로 구분할 수 있습니다.- 브랜드, 카테고리 등 명확한 검색 대상이 존재하는 유저- 탐색, 기능성 등 명확한 대상없이 제품 탐색이 필요한 유저첫번째 유형의 유저는 검색의 결과로 입력한 검색어에 정확하게 매칭되는 제품을 기대할 것이고, 두번째 유형의 유저는 일종의 여러 정보가 나타나기를 기대할 것 입니다.검색어 유형위의 유저 유형을 편의상 검색유저, 탐색유저라고 부르겠습니다. 검색창에서는 유저 유형마다 입력하는 검색어의 패턴이 구분 될 수 있습니다. 검색유저는 [나이키, 청바지, 줌 보메로]와 같이 찾고자하는 상품의 정보를 명확하게 입력할 것 입니다. 이러한 검색어는 주로 짧고, 명사중심의 특징이 있습니다.