카카오 미니 <사진=카카오 홈페이지 캡쳐>

[이뉴스투데이 김은지 기자] 카카오의 인공지능(AI)스피커 카카오미니가 대화하는 상대(화자)를 식별하고 한국어 외 지원 언어를 추가하는 등 한층 진화한다.

김훈 카카오 AI 부문 음성처리파트장은 25일 서울 종로 마이크임팩트스퀘어에서 열린 ‘AI 미디어스터디’에서 카카오가 추진하고 있는 이 같은 계획을 발표했다.

김 파트장은 “음성 인식은 일반적으로 사람 간의 대화처럼 사용자의 말을 기계가 알아듣고 이용자의 명령과 의도를 파악해 그에 따른 결과를 전달하는 과정”이라고 설명하며 “카카오는 음향 모델과 언어 모델을 최적화하고 고도화하는데 많은 노력을 하고 있으며, 그 결과 타사 대비 높은 수준의 음성 인식 성능을 보유하고 있다”고 말했다. 

카카오미니는 올해 상반기 중 보이스 프로필을 업데이트한다. 보이스 프로필을 등록한 이용자는 화자 인식 기반의 맞춤형 서비스를 이용할 수 있다. 카카오는 보이스 프로필 업데이트와 동시에 카카오톡 메시지를 읽어주는 기능을 업데이트한다. 

보이스 프로필을 등록한 이용자가 카카오톡을 활성화하면 이용자 본인이 아닌 사람의 요청에는 카카오톡 메시지를 읽어주지 않는 방식이다. 보이스 프로필은 이용자가 카카오미니 설정 앱에서 간단한 과정으로 자신의 목소리를 등록해 만들 수 있다.

이 같은 화자 인식 기술은 앞으로도 이용자 맞춤형 대화와 음성 인식률을 향상시키는데 활용될 계획이다. 말하는 사람의 목소리를 인식해 화자를 구별하는 기술인 ‘화자 인식’은 발화 시 음성 신호에서 특징을 추출, 등록된 화자 정보와 비교해 누가 누군지를 구별하고 동일 인물인지를 인식한다. 

화자 인식은 화자를 구별해 개인화된 서비스를 제공할 수 있는 기반 기술로서 음악과 뉴스, 상품 추천과 결제, 화자 이외 주변 잡음 제거 등에 사용될 수 있다.

또 카카오는 음성 엔진 적용 언어를 한국어에서 영어와 일어, 중국어 등으로 확장한다. 

현재 카카오미니의 영어 인식은 개발이 완료된 상태다. 카카오는 연내 번역 엔진과 결합해 카카오미니에 영어를 말하면 한국어로 번역해주는 개념의 음성 번역 기능을 업데이트할 예정이다. 카카오는 영어 음성인식의 오류가 날 확률을 약 10%로 보고 있는데, 이는 우리나라 사람의 영어발음에 따라 AI 스피커가 인식을 못할 가능성이 있기 때문이다. 

올해 상반기부터는 유명인과 연예인 목소리도 카카오미니에서 만나볼 수 있다. 현재 성우 목소리를 완전히 대체하는 수준은 아니며 특정한 상황이나 특정 대화에서 유명인·연예인 목소리를 들을 수 있게 된다.

아울러 카카오는 자사 서비스는 물론, 다양한 파트너에게 카카오 I를 제공해 확장성과 개방성을 기조로 한 음성 엔진 생태계를 구축할 계획이다.

김 파트장은 “앞으로 카카오 음성엔진은 AI 스피커에 국한하지 않고 다양한 파트너의 다양한 서비스와 제품에 제공돼 이용자들이 생활 속에서 카카오의 음성 기술을 만날 수 있도록 확장할 계획”이라고 말했다. 

카카오 I는 카카오가 보유한 AI 핵심 기술을 결합한 통합 AI 플랫폼이다. 음성엔진을 비롯해 대화엔진, 번역엔진 등 다양한 AI 기술이 집약됐다. 

카카오는 카카오미니 외에도 다음, 카카오내비, 카카오맵, 멜론, 브런치, 카카오톡치즈 등에 음성엔진을 적용 중이다. 이외에도 2014년부터 음성 인식과 음성 합성 기술을 오픈 API(Application Program Interface)로 공개해 수백 곳의 기업과 개인이 카카오의 음성 기술을 활용하고 있다.

지난해에는 현대자동차와 제휴해 제네시스G70, 싼타페, 그랜저 등 많은 차량에 카카오의 음성 엔진이 적용됐다. 

※ 여러분의 제보가 뉴스가 됩니다. 각종 비리와 부당대우, 사건사고와 미담, 소비자 고발 등 모든 얘깃거리를 알려주세요

이메일 : webmaster@enewstoday.co.kr

카카오톡 : @이뉴스투데이

저작권자 © 이뉴스투데이 무단전재 및 재배포 금지