[남영준 칼럼] 인공지능(AI)의 발전과 신종 부업 데이터 라벨링
[남영준 칼럼] 인공지능(AI)의 발전과 신종 부업 데이터 라벨링
  • 남영준
  • 승인 2022.10.10 03:00
  • 댓글 0
이 기사를 공유합니다

남영준 톡톡미디어 대표  (전 국제종합기계 대표)
남영준 톡톡미디어 대표 (전 국제종합기계 대표)

최근에 ‘데이터 라벨러’라는 직업이 있다. 전업으로 뛰는 사람도 있지만 부업으로 하는 사람이 많다. 직장인, 주부, 대학생의 신흥 알바로 인기이다.

데이터 라벨링은 인공지능 AI가 학습하도록 데이터에 이름을 붙여주는 작업이다. 즉 그림이나 영상에서 사물이나 사람 등을 객체별로 따주고 그것에 라벨을 붙인다. AI 시대에 나타나는 새로운 일자리이다.

AI는 어디서나 쉽게 만나는 세상이 되었다. 카드를 분실하고 신고하면 사람이 아닌 AI가 응대한다. 대부분 고객센터는 AI가 활동하고 있다. 네이버에서 음성으로 물어보면 AI가 알아듣고 검색해 준다.

컴퓨터는 인간이 만든 알고리즘을 통해 데이터를 초고속으로 처리하고 결과를 알려준다. 그러나 사람처럼 뜻을 이해하고 축적하여 새로운 결론을 도출해내지 못한다. 방대한 양의 데이터를 빠르게 처리할 뿐이다. 세월이 흐르면서 사람이 생각하고 판단하는 것처럼, 컴퓨터도 할 수 있도록 개발하기 시작했다.

사람은 자라면서 일상생활이나 학교에서 배운 걸 바탕으로 문제를 인식하고 판단한다. 이세돌과 바둑을 두어서 이긴 알파고는 바둑 두기와 바둑 더 잘 두기라는 학습을 통하여 만들어진 AI이다. 이세돌은 바둑만 잘 두는 게 아니라 다른 생활도 잘한다. 그러나 알파고는 바둑만 잘 둔다. 이런 면에서 AI는 아직 한계가 있다.

AI가 발전하려면 데이터 학습을 계속해야 한다. 사람이 초, 중, 고, 대학을 다니면서 지식이 쌓이듯이 인공지능도 계속 데이터를 학습해야 한다. 인공지능이 학습하는 데이터는 그냥 되는 게 아니라 기계가 인식하도록 라벨을 달아주어야 한다. 이것을 데이터 라벨링이라고 한다.

AI는 처음에 의자가 무엇인지 모른다. 의자를 인공지능이 읽을 수 있도록 이름을 달아준다. 의자도 둥근 의자, 회전의자, 철제 의자 등 종류가 많다. 이런 걸 AI에게 학습시킨다. 그래야 AI가 의자 같은 게 보이면 유추해서 판단한다. 자율주행은 AI가 필수적인데 도로 차선 표시, 신호등, 표지판 등 도로상에서 나타날 수 있는 모든 걸 인식시켜야 사고를 내지 않고 운행할 수 있다.

AI 학습에 필요한 데이터는 연료처럼 계속 공급해 주어야, 변하는 세상에서 AI가 제 역할을 할 수 있다. 문서, 사진, 영상, 음성 등 자료를 수집하고 이를 학습할 수 있도록 이름을 붙여주는 라벨링이 이루어져야 한다. 데이터를 수집하고 라벨링하는 모든 게 다 비용이 드는 일이다.

최근 신흥 부업으로 뜨는 데이터 라벨링은 AI가 발전하면서 라벨링 작업도 계속 증가하고 있다. 통계청에 따르면 2021년 데이터 라벨러가 100만명이 넘었다고 한다. 이 중 46%는 전업 라벨러인 것으로 추정된다.

데이터 라벨러의 수입은 어느 정도가 될까. 데이터 라벨링 작업은 보통 장당으로 비용을 계산한다. 한 시간에 50장정도 처리하면 시급 1만5~7천원 수준이다. 능숙도에 따라서 개인차가 크다. 컴퓨터 앞에 앉아서 집중하는 작업이므로 2시간 이상 지속하기 힘들다. 마우스를 계속 클릭하면서 해야 하므로 손목 부담이 많다. 고급 작업은 단가가 올라간다.

일하는 시간이 자유롭고, 간섭받지 않으며, 원하는 만큼 할 수 있어 괜찮은 부업으로 알려져 있다. 일하는 방법은 데이터 라벨링하는 회사에 회원으로 가입하고, 국민내일배움카드를 신청하여 교육을 받는다. 국민내일배움카드는 국가에서 교육비를 지원하는 제도이다. 데이터 라벨링은 매뉴얼만 잘 익혀도 할 수 있을 정도로 어렵지 않다.

 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.