[이뉴스투데이 노진우 기자] 국내 최대 소프트웨어(SW) 그룹인 한컴그룹은 세계 최대의 통신업계 전시회인 '모바일 월드 콩그레스(MWC) 2017'에 다양한 형태의 자동통번역 서비스를 선보이며 글로벌 통번역 시장 개척에 나섰다.

한컴그룹은 이번 전시회를 통해 음성인식 통번역 서비스인 ‘한컴 말랑말랑 지니톡’의 사용성을 대폭 높여, 넥밴드, 이어셋 형식의 웨어러블 통번역기와 인터넷 없이도 사용가능한 통번역 단말기(OTG), 번역 전문 플랫폼 등 한층 진보된 기술력을 선보였다.

이에 지니톡 개발자인 한컴인터프리 김무중 수석연구원을 만나 지니톡에 대한 궁금증을 풀어본다.

▲ 현재 가능한 언어 수는

-. 한국어, 중국어, 일본어,영어, 스페인어, 프랑스어, 러시아어, 독일어까지 가능하고 2018년에는 아랍어도 가능하다.

▲ 지니톡은 폰 베이스, USB 베이스, 페어러블 총 세 가지 형태로 출시되는 걸로 안다. 이 중 인터넷 연결 환경이 좋지 않은 곳에서 사용되는 USB 형태는 업데이트가 어느 정도 진행됐는지.

-. 우선 지니톡 페어나 USB를 출시한 이유는 구글이나 파파고 게시판을 보면 ‘인터넷 없는 환경에서 이용이 불가능하다’라는 고객 불만이 가장 많다. 해외에 나가면 3G 로밍이 되는데 저녁에는 속도가 늦어져 실시간 번역이 어려울 때도 있다. 때문에 오프라인 버전을 개발하게 됐다.

그런데 오프라인 버전은 저장용량이 작다 보니 특정 도메인에 한정된 번역과 음성인식 지식만 가지고 있다. 예를 들어 여행을 갔을 때 사용할 수 있는 콘텐츠만 담겨있는 셈이다. 이를 두고 일각에서는 ‘인식률이 떨어진다’고 평가하는 분들도 계신데 그렇다기보다 도메인 영역이 작게 적용 된 것 일뿐이다.

▲ 지역별 정보를 별도 변역 툴에 넣겠다고 하지 않았나.

-. 올해 중하반기 쯤에 그 시스템이 나올 예정이다. 네비게이션이 업데이트 되듯이 OTG를 꽂으면 가능한 시스템이다. 그렇게 되면 미국 플로리다로 여행을 갔을 때 그 곳의 지역 음식이나 고유 명사도 통역이 가능하다.

주변에서 ‘자동통역으로 돈을 벌 수 있느냐’고 많이들 묻는다. 지니톡은 지역별 특화 도메인 인식으로 그들만의 번역 엔진을 제공으로 고객들에게 가치를 제공하고 이게 수익 창출이 되지 않을까 생각한다.

넥밴드형 통역기도 있다. 손 동작을 많이 요구하지 않아 상대방과 눈을 마주쳐서 대화할 수 있는 게 특징이다. 소음이 심한 환경에서도 인식이 가능할 수 있도록 특수 기법을 적용했다. 신호를 핸들링해서 이용자가 말하는 타이밍을 스스로 잡아내는 기술도 적용할 예정이다.

▲ 일반적으로 소음이 많은 곳에서 이용자 음성을 정확히 인식하기 위해서는 노이즈와 일반 노이즈를 상쇄시켜 보이스만 살리는 기능(노이즈 캔슬링)을 쓰는 데 이것과 유사한가.

-. 상쇄시켜서 노이즈를 없애면 본래 소리도 사라지는 단점이 있다. 노이즈 캔슬링은 없어지면 안되는 데이터도 없어져서 인식률이 떨어질 때가 있다. 이 부분에 대해 많이 고민했고  ‘소리는 입 말고 다른 곳에서도 감지가 된다’고 판단해 그 소리를 활용하는 데 중점을 뒀다.

▲ 그렇다면 마이크 기능이 섬세해야 할 것 같다.

-. 이 부분은 MWC 2017에서 공개될 예정이다. 기기 버튼을 누르지 않고 현지인과 눈을 마주치며 대화하는 시연을 준비 중이다. 단독 진행 사항이 아니라 여기까지만 말씀 드릴 수 있다.

▲ 현재 번역률 어느 정도인가.

-. 음성인식은 어느 정도까지 가능하고 인식률을 %로 표현할 수 있지만 번역은 그게 아니다. 번역 품질은 전문가 5명이 평가한다. 각자 1점부터 4점까지 점수를 매기는 데 사람마다 평가하는 점수가 다르다. 이 중 최소 점수와 최대 점수를 뺀 나머지 점수를 평균 낸다. 그렇기 때문에 사람의 관점에 따라 품질 측정은 달라진다.

어떤 도메인이느냐에 따라서도 평가가 다르다. 때문에 품질을 논하긴 어렵다. 다만 사람들의 불만이 과거 30~40% 정도였다면 현재 10~20%로 줄었다고 말할 수 있다. 기존 대비 기능이 50% 정도 향상된 셈이다.

중문을 인식하는 것을 알 수 있다. 중문 번역 수준이 상당히 높다. 성능이 획기적으로 업그레이드 됐는데 이달 말에 더욱 안정화 될 것으로 본다.

▲ 이미지 캡쳐 번역이 되는 번역기도 있던데.

-. 우리도 3월 말 4월 초쯤 오픈 할 예정이다. 이미지 번역은 요구사항이 많은 인터페이스다. 이 기술이 어려운 것은 글씨 폰트 확인이 안되면 구현하기가 힘들다는 점이다. 그래서 우리는 러시아 회사와 협력하고 있다. 좋은 것은 가져다 쓰겠다는 게 우리 정책이다.

이미지 번역은 완벽한 문장이 아닌 단어를 기반으로 하기 때문에 그 품질을 개선할 수 있는 번역 메커니즘을 고민하고 있다. 함축적 의미를 가진 단어를 번역하는 경우 어떻게 해석할 것인가에 대한 고민이다.

▲ 지역별 방언이나 톤 등이 통역 툴의 인식률을 저하시킨다는 지적이 있었는데. 어떻게 보완하나.

-. 아예 단어가 다른 방언들이 존재하기도 하는 데 이 경우 발음 사전이나 랭귀지 모델에 넣으면 되기 때문에 커버할 수 있다. 문제는 어르신들의 어눌한 발음이다. 발화 자체가 어물거리다 보니 기술적 커버가 어렵다. 음성(발음)적인 부분은 커버할 수 있어도 음향적인 부분은 커버가 안된다.

▲ 외국인들이 한국말을 할 경우 인식률이 떨어지지 않겠는가.

-. 저희가 가장 고민하는 게 ‘평창동계올림픽 때 외국인들이 한국에서 단순히 발음기호를 보고 읽을 텐데 이것을 어떻게 커버하느냐’다. 그래서 올 2분기 이후 영어를 사용하는 사람들이 한국어 고유명사를 발음할 때 패턴이 어떤지 확인하고 모델링 하는 작업을 할 계획이다. ETRI와 공동 진행한다.

▲ 평창동계올림픽에서 홍보 효과를 어떻게 기대하는지.

-. 시기가 좋다. 2018 평창동계올림픽 이후 2020 도쿄올림픽, 2022베이징올림픽이 쭉 있다. 이번 평창올림픽에서 서비스가 잘 되면 타국의 엔진과 결합해 서비스를 제공하는 형태가 가능하지 않을까 생각한다.

▲ 일반 사람들이 구글이나 파파고 보다 지니톡을 잘 알지 못한다. 이 부분 어떻게 극복할 것인가.

-. 지니톡은 실생활 밀착형이다. 그러므로 주요 터치 포인트인 인천공항이나 서울역 이런 곳에 설치하는 방안도 괜찮을 것 같다. 또는 미래부가 추진 중인 체험관이나 홍보관에 설치해서 외국인에게 배포할 예정이다.

키워드
#N

※ 여러분의 제보가 뉴스가 됩니다. 각종 비리와 부당대우, 사건사고와 미담, 소비자 고발 등 모든 얘깃거리를 알려주세요

이메일 : webmaster@enewstoday.co.kr

카카오톡 : @이뉴스투데이

저작권자 © 이뉴스투데이 무단전재 및 재배포 금지