차세대 음성인식 엔진 및 통번역 기술개발 ‘속도’…갤럭시S 등 기기탑재 상용화 준비

현재 데모 가능 기술 수준, 음성인식 구글·애플 추격…온디바이스 인공지능 보편화 주도

심은수 삼성종합기술원 AI&SW연구센터장이 23일 서울 코엑스에서 열린 '세미콘코리아2019' 기조연설의 연사로 나서 '온디바이스 인공지능'을 주제로 발표하고 있다. 사진=김언한 기자
[데일리한국 김언한 기자] 삼성전자가 인공지능(AI)을 적용한 차세대 음성인식 기술 개발에 속도를 낸다. 스마트폰 음성인식서비스인 애플의 시리, 구글 어시스턴트의 한계를 넘어 실시간 대응·통역 시대를 열어간다는 구상이다.

23일 심은수 삼성종합기술원 AI&SW연구센터장은 서울 코엑스에서 열린 '세미콘코리아2019' 기조연설에서 "인공지능 아키텍처를 기반으로 하는 음성인식 엔진 '엔트투엔드 ASR'을 개발하고 있다"며 "현재 내부에서 데모할 수 있는 수준으로 상용화를 염두에 둔 것"이라고 말했다.

삼성 내부에서 임의적으로 붙인 엔진명 '엔트투엔드 ASR'의 ASR은 자동언어인식을 일컫는 'Automatic Speech Recognition'에서 앞글자를 딴 것이다. 클라우드 기반으로 구동돼 기기단에서 자체 연산할 때 발생하는 메모리 소모를 낮추게 된다. 빅스비와 함께 음성인식 경쟁력을 한 단계 끌어올릴 것으로 기대된다.

엔트투엔드 ASR은 뉴럴 네트워크를 사용하는 딥러닝 모델을 통해 설계됐다. TV, 라디오 등 소음이 있는 환경에서 음성인식의 정확성과 속도를 높이게 된다.

심은수 센터장은 또 이날 기조연설에서 인공지능을 통해 통번역이 가능한 기술을 개발하고 있다고 밝혔다. 통번역 엔진으로 외국어 인식 정확도를 높여 통번역의 정확성을 높이는데 방점을 뒀다. 현재 삼성종합기술원 내부에서 스마트폰에 적용된 이 기술을 시험 중이다. 개발완료 시 스마트폰 등에 들어가 실시간 통번역 역할을 하게 될 것으로 기대된다.

현재 애플의 시리는 실시간 통역이 가능한 통역 기능을, 구글 어시스턴트 또한 '통역사 모드'를 제공하고 있다. 구글은 지난 2017년 자사 최초 무선이어폰인 픽셀 버드(Pixel Buds)를 발표하면서 실시간 통역 기술을 활용했다.

구글의 스마트폰 ‘픽셀’과 연동하면 실시간으로 입력 받은 말을 다른 언어로 번역한 다음 스마트폰 스피커를 통해 재생해주는 식이다. 이를 이용하면 이어폰을 착용한 사람이 말하는 내용 뿐 아니라 상대방이 말하는 내용을 다시 번역하는 것도 가능하다.

사진=김언한 기자
삼성전자의 스마트폰에 탑재된 음성비서 '빅스비'는 현재 기본적인 번역만 가능하다. 통번역 기능이 강화될 경우 삼성이 향후 출시하게 될 이어폰 등에 접목돼 응용범위가 확대될 것으로 전망된다. 심 센터장은 기자와 만나 "현재 회사 내부적으로 쓰고 있지만 상용화를 염두에 둔 것"이라고 말했다.

아울러 이날 심 센터장은 폭증하는 데이터 대응에 엣지단 처리가 늘며 온디바이스 인공지능이 보편화될 것으로 내다봤다. 심 센터장은 "네트워크로 보내는 것보다 로컬 디바이스단에서 데이터를 처리하는 게 에너지효율 측면도 훨씬 높다"며 "이런 동기를 갖고 온디바이스 기술을 개발하고 있다"고 설명했다.

그는 또 "NPU(뉴럴프로세싱유닛)가 과거 CPU처럼 새로운 프로세싱 코어가 되기 위해선 알고리즘 혁신이 필요하다"며 "삼성은 이를 주도하기 위해 액티브하게 연구개발에 나서고 있다"고 강조했다.

저작권자 © 데일리한국 무단전재 및 재배포 금지