프로젝트 성공 사례 #03 해상 자율주행 솔루션 개발을 위한 학습 데이터 가공기
해상 자율주행 솔루션 개발을 위한 학습 데이터 가공기
선박 이미지 전처리 및 고객사 요구사항에 따른 태깅/라벨링 작업기
고객사 요구사항
- 고객사가 제공하는 소스데이터 이미지 전처리(작업유효 및 불가 구분)
- 고객사에서 정의한 수정 가이드에 맞게 라벨링 및 태깅 작업 검수/ 수정
- 긴급 프로젝트로 가능한 빠른 납품 요망
고객사에게 어떤 어려움이 있었나요?
자율운항 솔루션의 성능을 올리기 위해서는 다양한 데이터를 통한 학습이 필요한데요. 수도 없이 많은 시행착오와 수정, 그리고 검수를 번복하는 과정에서 라벨링에 대한 부담이 가중될 수 밖에 없었습니다.
게다가, 1차적으로 라벨링이 된 데이터에 대해 2차 수정 및 보정을 하기 위해서는 정확한 가이드의 이해와 전문 PM의 모니터링 등이 필수적이었죠. 정해진 시간 내에 내부 일정을 맞추기 위해 전전긍긍하던 그때를 생각하면 아직도 아찔합니다.
크라우드웍스를 선택한 이유!
- 영업 및 운영의 빠르고 정확한 커뮤니케이션 대응
- 특수 산업 프로젝트에 대한 영업 및 운영의 높은 이해도
- 크라우드소싱 방식으로 고객사가 요구하는 빠른 납품이 가능
- 검수 시스템을 통한 높은 퀄리티의 데이터 확보
크라우드웍스 솔루션
데이터 전처리 및 가공
가장 먼저 할 일은 바로 고객사로부터 제공받은 ‘선박’ 관련 오픈소스 데이터 중에서 작업에 부합하지 않는 이미지를 필터링하는 작업이었습니다. 여기서 ‘작업에 부합하지 않는’ 이미지는 자율운항 솔루션 그리고 실제 선박과는 거리가 먼 사진들이었죠. 예를 들면, 선박의 실물 이미지가 아닌 일러스트레이션이라던지, 실내 액자에 걸려있는 선박 사진이라던지요!
하지만 이렇게 걸러낸 이미지들은 오픈소스 데이터였기 때문에 이미 약 20가지의 태깅 값이 설정이 되어있었는데요. 쓸모없는 태깅 값은 모두 지우고 8개의 선박 종류(Boat, Ship, …)로 구성된 신규 태깅 값을 재정의된 바운딩 박스 규격에 맞게 재가공하여 유의미한 데이터로 변형시키는 과정이 필요했습니다.
인력 매칭 기술을 통한 최적의 작업자풀 구성
빠른 시간 내에 프로젝트의 정확도를 높이기 위해 크라우드웍스가 준비한 놀라운 솔루션은 바로, 선박 그리고 항만 관련된 경력이 있는 작업자들로 이루어진 최적의 드림팀을 꾸리는 것! 작업자들의 반려가 지속되면, 프로젝트는 그만큼 지연될 수 밖에 없기 때문에 크라우드웍스가 보유한 인력(작업자-작업)매칭 기술을 활용하여 처음부터 실력있는 작업자들로 프로젝트를 꾸리는 방법을 택했습니다.
크라우드웍스의 작업자-작업 매칭 기술은 플랫폼의 로그 데이터와 프로필 데이터를 기반으로 작업자별 이력과 성과를 분석하여 작업자의 특성과 선호를 다차원으로 정의한 빅데이터를 기반으로 프로젝트의 컨텍스트와 작업자의 프로필, 이력, 성과 평가 데이터를 통해 프로젝트 상황에 최적화된 작업자 그룹을 생성하고 전문적인 작업자가 고품질의 데이터를 구축하죠.
결과는 성공이었습니다! 1개월 동안 9만 장이 넘는 이미지 데이터의 가공과 검수를 성공시켰다는 놀라운 이야기.