레이더M M-PRINT GFW CITYLIFE LUXMEN 매경이코노미 MBN골드 MBN 매일경제
로그인|회원가입 |시청자 게시판
종목검색
  • 종목검색
  • 통합검색

헤드라인

광고
프로그램 바로가기
프로그램 바로가기 닫기
가나다순 카테고리순
> 뉴스 > 기사
기사목록|||글자크기 
"데이터라벨링 알바 생각보다 쏠쏠하네"
기사입력 2020-10-21 23:14
  • 기사
  • 나도 한마디
공유하기 
"응, 우유에는 수면의 질을 향상시키는 이소플라본이라는 물질이 풍부하거든. 또 우유 속 칼슘은 수면호르몬인 멜라토닌의 분비를 도와주고."
지난 14일 서울 영등포구의 한 녹음실. 기자는 사람 목소리 외에 어떤 소리도 들어가지 않도록 방음 처리된 방 안에서 준비된 문장을 읽었다.

인공지능(AI)의 음성 인식 기능을 향상시키기 위한 학습용 데이터 확보 작업의 일환이다.

참여자들은 약 1700개의 문장을 읽어야 하는데, 실수없이 진행해도 꼬박 2시간 30분이 걸린다.

쉬는 시간을 가질 수 있지만 계속 문장을 읽다 보니 금세 목이 마르고 말이 꼬이기 다반사였다.


자연어 처리 솔루션 개발업체 NHN다이퀘스트와 함께 음성 정보를 구축하고 있는 '셀바스AI'의 윤재선 이사는 "전국 녹음실 8곳에서 이런 식으로 음성 데이터를 모으고 있다"며 "한 질문에 다양한 형식의 대답을 듣는 언어 모델 구축 작업과, 성별·연령대별 음성 정보를 바탕으로 한 음향 모델 구축 작업이 진행중"이라고 설명했다.


일당 8만원(세전) 가량으로 지원자들은 학생은 물론 50대 주부부터 자영업자까지 다양하다.


정부가 '디지털 뉴딜' 정책을 발표한 후 데이터 관련 일자리가 늘어나고 있다.

민간 영역에서도 '데이터 라벨링'을 부업으로 찾는 사람들도 늘고 있다.

'데이터 라벨링'은 사진이나 동영상, 텍스트, 음성 등 다양한 종류의 데이터를 AI가 학습할 수 있는 형태로 가공하는 업무를 말한다.

얼굴 사진을 예로 들면 눈, 코, 입 등의 부위에 '라벨'을 달아 구분해주는 식이다.


'데이터 라벨링'의 분야는 다양하다.

가령 자율주행차 분야에서는 도로 주변 사물에 대한 데이터 처리 작업을 진행한다.

정지 이미지를 보고 차선이 점선인지 실선인지 구분하거나, 차량의 이동 패턴을 분류해야 한다.

언어 번역 분야에서는 지명이나 인물명 등 고유명사가 정확하게 표기됐는지 검수하는 작업 외에도 문장 번역의 완성도를 높이는 작업이 진행된다.


'데이터 라벨링'은 단순 업무가 많아 남녀노소 누구나 할 수 있고, 출퇴근을 하지 않고 자투리 시간을 활용할 수 있다는 점이 장점이다.

한 번역앱에 한국어-영어 번역문장을 올리는 작업을 하고 있는 취업준비생 유지은 씨(가명·24)는 "많은 돈은 아니지만 취업에 필요한 공부를 하면서 생활비를 벌 수 있어서 시작했다"며 "시간·공간에 제약없이 자신의 능력에 맞춰 일을 할 수 있다는 점이 매력적이라 취업 후에도 계속할 생각이다"고 밝혔다.


윤 이사는 "현재 국내 데이터 라벨링은 AI의 학습용 데이터 구축을 위한 정보의 양적 확보에 급급한 경우도 많아 수준이 아주 높은 건 아니다"면서도 "데이터가 쌓여 오픈 소스 형식으로 알고리즘 개발이 이뤄진다면 기술의 비약적인 향상에 기여할 것"이라고 말했다.


[이진한 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]


#셀바스AI #NHN

기사목록|||글자크기