삼성리서치 산하 폴란드연구소와 베이징연구소는 '구술 언어 번역 국제워크숍(IWSLT)'에 참가해 두 개의 개별 과제에서 1위를 기록했다.
IWSLT는 국제학술대회인 전산언어학협회(ACL) 콘퍼런스에 포함된 워크숍으로 국제적인 권위를 인정받고 있다.
폴란드연구소는 영어로 된 테드 강연을 독일어로 번역하는 과제에서 '오디오-텍스트 번역' 부문 1위에 올랐다. 연구소는 입력된 음성을 곧바로 번역하는 엔드 투 엔드(E2E) 시스템을 활용했다.
베이징연구소는 '오픈 도메인 번역'에서 일본어와 중국어 간 번역 부문 우승을 차지했다. 연구소는 대형 번역 모델 설계를 기반으로 한 '상대적 위치 어텐션'으로 사전 데이터 처리를 정교히 했다.
아울러 바이트 페어 인코딩(Byte Pair Encoding)을 통해 단어를 의미 있는 단위로 쪼갠 결과물과, 문장을 구성한 조각들을 비교했다. 신경망 기계 번역(NMT) 성능 향상을 위해 단일 언어 말뭉치를 본래 언어로 역번역하는 과정도 포함돼 이목을 끌었다.
이 밖에도 폴란드연구소는 국제전기전자공학회(IEEE)가 지난달 개최한 DCASE 2020에서 이례적인 소리 감지 과제에서 2위를 차지했고, 베이징연구소도 지난 6월 컴퓨터 비전 분야 학회 CVPR 2020에서 3개 부문 2위를 차지하는 등 기술력을 인정 받고 있다.
심정선 기자
다른 기사 보기