삼성전자의 실시간 인공지능(AI) 통역 기능은 꽤 복잡한 언어적 도전을 극복하고 있습니다.
예를 들어, 삼성 갤럭시 스마트폰에서 제공되는 아랍어 옵션은 방언만 30여 종에 달합니다. 아랍어는 세계에서 여섯 번째로 많이 사용되는 언어로, 20여 국에서 4억 명 이상이 사용하고 있습니다. 그러나 지역별로 발음, 어휘, 억양이 다르기 때문에 이를 정확히 이해하고 통역하는 것은 어려운 과제입니다.
이를 위해 삼성전자 요르단 연구소는 여러 방언의 미묘한 차이와 변형을 정확히 이해할 수 있는 원어민 특별팀을 구성했습니다. 이 팀은 다양한 출처에서 수집한 각기 다른 방언의 음성 녹음을 듣고, 그것을 일일이 글과 문장으로 바꾸는 수작업을 진행하여 아랍어 실시간 AI 통역 모델을 완성했습니다.
삼성은 아랍어를 포함해 총 16개 언어에 대해 AI 통역을 지원하고 있으며, 연내에 루마니아어, 튀르키어 등 4개 언어를 추가할 계획입니다.
AI 통역을 구현하기 위한 학습은 상당히 어려운 과정이라고 볼수 있습니다. 통역 모델은 자동 음성인식 (ASR)을 통해 음성을 텍스트로 인식하고, 인공 신경망 기반 기계번역 (NMT)을 거쳐 번역된 텍스트를 다시 음성으로 변환합니다.
NMT는 문장을 통째로 외워서 번역하는 방식으로, 맥락에 맞는 통역을 제공하는 기술입니다. 언어 특징별 맞춤형 학습법이 자연스러운 통역의 핵심이며, 삼성은 각 나라의 언어에 맞춘 특별한 학습법을 적용하여 통역 수준을 높이고 있습니다.
출처: Copilot, 조선일보,삼성전자홈페이지