본문내용
1. 연구 동기와 목적
1.1. 통번역가를 꿈꾸는 동기
통번역가를 꿈꾸는 동기이다. 나는 현재 중어중문학과 소속으로 어학을 전공하고 있다. 나의 대학 진학 목적은 바로 통번역가가 되는 것이다. 다른 사람들에게 번역은 단순한 일일지 모르지만, 나에게 '번역'이라는 행위는 매우 중요한 의미를 지닌다. 언어를 매개로 한 문화와 가치의 전파가 인류에 미치는 영향은 크다고 믿기 때문이다. 번역의 중요성을 알고 있으며, 좋은 번역을 하기 위해 어학 공부를 열심히 하고 있다. 그러나 이 4차 산업혁명 시대에 발맞추지 않고 어학 공부만 할 수는 없다고 생각한다. 나는 어학 실력 외에 기계번역의 발전에 대해 연구할 필요가 있다고 판단했다.
기계번역의 원리와 종류 및 현재 기계번역의 입지에 대해 파고들게 된 이유는 두 가지 질문 때문이다. 첫째, 나에게 필요한 것은 어학 실력 외에 무엇일까? 둘째, 발전된 기계번역이 사람을 점점 대체하게 될 미래를 대비하여 나는 무엇을 연구해야 하는가? 이 두 질문은 나를 기계번역에 대해 깊이 있게 탐구하게 만들었다.
1.2. 기계번역의 발전과 새로운 도전
2016년, 인공지능 알파고가 프로 바둑기사 이세돌 9단과의 바둑 시합에서 승리하며 전세계가 떠들썩해졌던 것과 같이, 번역 산업에서도 인공지능의 시대가 열렸다. 번역 산업에서 인공지능이 등장하면서 그 기술은 급속도로 진화하며 우리 일상생활에 침투하고 있다. 미국의 대표적인 인터넷 포털 사이트인 구글의 '구글 번역(Google Translate)'과 한국에서의 대표적인 인터넷 포털 사이트인 네이버의 '파파고(Papago)는 사람의 뇌가 학습하는 과정을 번역에 적용한 인공신경망 기계번역(NMT) 기술을 사용하고 있다. 파파고와 구글번역에서의 번역은 기존에 사용하던 통계 기반 또는 규칙기반의 기계 변역 대비 오류를 최대 85%까지 낮추고 있다. 인공지능(AI)라는 큰 개념은 1956년 다트머스 회의에서 처음 논의 되었지만, 기계 번역은 그보다 2년전인 1954년에 실증적인 기술이 등장 할 정도로 연구가 활발히 진행되고 있었다. 당시의 기술은 인공지능을 적용하지 않은 단순 규칙과 통계를 기반으로 한 것이었지만, 이후 인공신경망 기술이 도입되면서 진정한 인공지능 번역기가 등장했다. 이렇게 기계번역 기술이 고도로 발전하여 번역 결과물의 품질이 매우 향상되었고, 시간도 줄일 수 있었지만, 포스트 에디팅 작업은 아직 필요성이 충분히 남아있다. 즉, 기계번역 결과물의 품질과 효율성을 더 높이기 위해서는 포스트 에디팅을 통한 인간의 개입이 아직 필요하다. 이러한 변화의 물살 속 번역가의 입지가 좁아지는 가운데 '포스트 에디팅'이라는 개념의 등장은 향후 하나의 대안이 될 수 있다. 특히 문학이 번역되는 시간과 인력, 돈이 감소된다면 문학은 더욱 더 국가의 경계를 허물고 세계에 퍼질 수 있을 것이며, 더 다양한 사람들에게 다양한 이야기를 들려줄 수 있을 것이다. 이에 따라 기술과 소프트웨어, 그리고 컴퓨터에 대해서 더 공부하면서 기계번역 연구 분야에서 문학 및 언어 전문가로 초빙되어 문학을 기계번역 하는데에 있어서 더 발전할 수 있도록 돕고자 한다. 이것이 바로 진정한 과학기술과 인문의 조화라고 생각된다.
2. 기계번역의 발전과 현황
2.1. 인공지능과 신경망 기반 기계번역
2016년, 인공지능 알파고가 프로 바둑기사 이세돌 9단과의 바둑 시합에서 승리하며 전세계가 떠들썩해졌던 것과 같이, 번역 산업에서도 인공지능의 시대가 열렸다. 구글의 '구글 번역(Google Translate)'과 네이버의 '파파고(Papago)는 사람의 뇌가 학습하는 과정을 번역에 적용한 인공신경망 기계번역(NMT) 기술을 사용하고 있다. 이들 인공지능 번역기의 번역 품질이 기존 방식 대비 오류를 최대 85%까지 낮추고 있다.
인공신경망은 원문을 번역문으로 번역할 때 원래의 문장을 벡터값으로 전환한다. 해당 벡터 속에는 문법, 어순, 단어 등 다양한 사항들이 포함되어있다. 인공신경망은 이러한 요인들을 고려하여 정확도가 높은 번역문을 산출해내는 것이다. 사람은 뉴런, 즉 신경세포 기본 구조 단위를 통해 감각기관에서 받은 정보를 뇌로 보내고 주위 사물과 여러 환경 간의 복잡한 관계들을 종합적으로 명령과 판단을 하게 되는데, 이러한 인간 두뇌의 정보 처리 방법을 모방하여 응용한 기술이 바로 인공신경망 번역기술이다.
또한 기계번역이 스스로 학습하는 기술도 개발되고 있는데, 대표적인 기술로는 디노이징(Denosing)과 역번역(Back Translation)이 있다. 역번역은 원문에서 번역문으로 번역하고 다시 그 번역문을 원문의 언어로 번역한 후에 기존 원문과 유사성을 확인함으로써 스스로 정확도를 개선하는 것이다. 디노이징은 이것보다 조금 더 복잡한데, 역 번역을 하면서 문장에 단어를 추가하여 원문의 언어로 번역하게 한 뒤, 그 유사성을 분석하여 정확도를 높이는 기술이다. 이와 같이 기계번역은 다양한 과정들을 거치면서 상당한 수준에 이르렀고 현재에는 인간 번역을 대체할 수 있다는 전망도 나오고 있다.
인공신경망 기반의 기계번역은 통계 기반 또는 규칙 기반의 기계 번역 대비 문맥을 파악하는 데 월등히 좋은 성능을 보인다. 기계 번역기 등장 초반, 즉 통계 기반 번역이었을 때에는 많은 번역 오류로 인해 사람들이 번역기보다 사전을 사용했었지만, 인공신경망 기계번역 기술의 경우 빅데이터를 기반으로 한 번역 기술을 통해 더 자연스...