국내 AI 스타트업 트위그팜이 25일 보도자료를 내고, 자체 개발한 하이브리드 번역기가 번역기 품질을 평가하는 ‘BLEU 평가’에서 구글 번역보다 높은 성적을 달성했다는 내용을 전해왔다. 이 발표가 흥미로웠던 것은, 사실 AI 번역이란 후발주자가 선두 업체를 따라잡기 쉽지 않은 영역이기 때문이다.
AI 번역 품질의 성패는 대부분 학습 데이터의 규모와 알고리즘 수준에 따라 결정된다. 특히 가장 중요한 기반인 실사용 데이터의 확보는 아무래도 장기간 서비스를 유지, 많은 이용자를 확보하고 있는 선발주자들이 크게 유리한 지점이다. 그렇다면 남은 건 알고리즘의 차별화다. 트위그팜은 어떤 방식으로 구글 번역을 앞섰다는 걸까?
AI 번역기에게 사전을 쥐여주었다
이들이 내세운 무기는 바로 ‘번역사전’이다. 트위그팜의 하이브리드 번역기는 문서를 분석해 많이 사용되는 단어와 문장을 추출하고, 이를 어떤 분야의 어떤 용어로 번역해야 할지 결정한다. 같은 문장이라도 분야별로 의미가 다르게 쓰이는 말들을 더 정확하게 번역할 수 있도록, 일종의 ‘전문용어 사전’을 활용한다는 의미다.
일반적으로 범용 AI 번역기는 특정 문장을 번역할 때 확률적으로 더 많이 쓰이는 단어의 의미를 고르는 경향이 있다. 분야를 특정하기 어렵다면 더 자주 쓰이는 말을 선택해야 오역 확률을 줄일 수 있기 때문이다. 이 때문에 상대적으로 사용량이 적은 전문분야에서의 번역기 품질은 여전히 일상 번역과 비교해 좋지 않은 편이다.
이번에 트위그팜이 구글 번역기보다 높은 점수를 얻은 분야도 △법률 △금융 △기계 △ 의료로 모두 전문 분야에 해당된다. 비교에 쓰인 BLEU 평가는 기계 번역과 인간 번역의 결과가 얼마나 유사한지를 평가해 번역기 품질을 수치화하는 방식이다.
트위그팜 관계자는 기자와의 통화에서 “별도의 용어사전을 활용하는 것 외에도, 수많은 용어사전 중 어떤 사전이 문장 속 내용과 가장 부합하는지 분석하는 자체 알고리즘도 이번 결과에 큰 영향을 미쳤다”고 설명했다. 트위그팜은 현재 하이브리드 번역에 대한 특허 출원을 완료한 상태다.
인간 번역의 몫, 점점 줄어들 수 있어
한편, 이번 테스트 결과는 인간과 기계의 미래 번역 일자리 경쟁에 또 다른 변수가 생겼다는 점을 의미한다. 최근 번역기 품질이 점점 높아지는 가운데, 인간 번역사들이 한동안 더 기계를 앞설 것으로 예상되던 영역이 바로 전문 번역이다.
그러나 이번 사례처럼 전문 분야에서도 일상 번역 못지않은 수준을 달성하기 위한 기술들이 계속 등장하기 시작하면서, 인간과 기계의 번역 일자리 구도에 보다 이른 변화가 찾아올 가능성 또한 높아지고 있다. 물론, 인간 번역사의 수요가 완전히 사라지는 일을 없겠지만 관련 기술이 발달할수록 그 파이는 점점 더 줄어들 것으로 예상된다.
트위그팜이 이번에 공개한 번역기는 기업을 위한 맞춤형 ‘API 번역 서비스’, 번역 회사를 위한 솔루션 ‘지콘스튜디오’, 이메일 기반의 번역 서비스 ‘헤이버니’ 등에 적용될 예정이다.
[이건한 기자]