글나무는 과학기술정보통신부가 주관하고, 한국지능정보사회진흥원(NIA)이 추진하는 2022년 인공지능 학습용 데이터 구축사업의 하나인 관광 음식 메뉴판 데이터 구축 과제의 주관 사업자로 선정됐다고 22일 밝혔다.
음식 메뉴판 이미지-OCR-지식 정보로 구성된 다중쌍 융합 데이터와 한국어-다국어 번역 데이터를 구축하는 이번 사업에는 주관사 글나무를 비롯해 ▲관광 음식 콘텐츠·시스템 구축 전문 기업 아로정보기술 ▲딥러닝 기반의 자연어 처리 전문 기업 트위그팜 ▲전문 통·번역사 양성 기관인 한국외국어대학교가 참여한다.이번 사업은 인공지능 기반 OCR 기술 향상, 인공지능 기계 번역기 품질 개선, 크라우드소싱을 통한 양질의 일자리 창출 등을 목표로 한다.
이를 위해 메뉴판 이미지 데이터와 OCR 데이터 10만 건을 구축하고, 50만 건이 넘는 메뉴 지식 정보를 수집해 한영, 한일, 한중(간체자, 번체자) 번역 데이터 200만 건 이상을 구축할 계획이다.
다양한 형태의 메뉴판 이미지와 향토 음식을 포함한 한국의 수많은 음식 메뉴명을 수집하기 위해 서울, 부산, 대구, 인천, 광주, 대전, 울산 등 광역 지방자치단체뿐 아니라 경기, 강원, 충청, 전라, 경상, 제주 등의 일반 지자체에 있는 음식점의 메뉴판을 수집 대상으로 선정했다. 메뉴판 이미지 촬영을 위해 현지 인력을 동원하기 때문에 13개 지역의 일자리 창출에도 이바지할 것으로 기대된다.
문선희 글나무 대표는 “이번 과제로 표준화된 음식명 번역 데이터를 구축해 외국어 메뉴판을 제작하는 전국 지자체, 기업이 활용하기를 희망한다”라고 말했다.