프로젝트 성공사례#29 MHNCITY의 차량 번호판 인식 및 비식별화 AI 자동 솔루션 개발기
MHNCITY의 차량 번호판 인식 및 비식별화 AI 자동 솔루션
차량 번호판 이미지 수집 및 가공기
고객사 요구사항
- 차량의 번호판을 식별할 수 있는 이미지 데이터 수집 (2,000장)
- 촬영된 이미지 내 적정 차량 대 수(최대 8대)
- 번호판 유형 분류: 일반 차량번호판(70%), 구형(10%), 운수형(10%), 전기차(10%)
- 이미지 데이터 1개당 결과데이터의 경우 txt파일로 만들어져야 함
고객사 소개
MHNCITY의 기업연구소는 4차 산업혁명 시대의 Computer Vision 분야를 연구개발하는 유닛입니다. 구성원 모두가 4C(Communication, Co-Work, Curiosity, Creation)활동을 통해 차별성과 효율성을 추구하기 위해 노력합니다. 고객사는 빠르게 변화하는 Computer Vision 분야에서 기민하게 대응하기 위해 먼저 예상하고, 새로운 기술 도입에 대한 다양한 연구를 진행하고 기술 부채를 줄여나감과 동시에 코드 퀄리티와 개발 생산성을 높여 회사의 성장을 빠르게 가속시키는데 크게 기여하고 있습니다. 추가적으로, MHNCITY는 과학기술정보통신부와 한국지능정보사회진흥원에서 진행하는 <2022년 공공부문 이용 *SaaS 개발·검증 사업>과 경찰청, 과학기술정보통신부가 공동으로 추진하는 <2022년도 치안현장 맞춤형 연구개발사업(폴리스랩 2.0)>에 착수하는 성과를 이루게 되었으며, 2022년 중소기업 연구인력지원사업 우수기업으로 선정되었습니다.
고객사에게 어떤 어려움이 있었나요?
정부 사업의 일환으로 진행되었던 프로젝트로, 고객사는 제한된 마감 일정과 기간 내 약 9천장에 해당하는 차량 번호판 이미지 수집 및 가공이 필요했습니다. 하지만, 차량 번호판은 ‘개인정보’에 해당하는 영역이었기에 대량의 개인정보를 수집하는데 어려움을 느끼고 있었죠. 이에 크라우드웍스는 크라우드소싱 방식을 통해 작업자가 차량번호를 자체를 스스로 비식별화하여 데이터를 업로드하는 방식을 떠올림으로써 개인정보 이슈 해소와 동시에 안정적인 데이터 확보를 할 수 있는 방법을 제안하였습니다.
또한, 일반차량, 운수용차량, 전기용차량 등 종류에 따라 각각 수집 및 가공되어야하는 데이터의 수량이 상이하고, 이미지 내에 포함되어야하는 자동차의 수 등의 조건이 있어 고객사는 데이터를 수집하는데 더욱 큰 애로사항을 겪고 있었습니다.
크라우드웍스를 선택한 이유!
- 국내 최대 크라우드워커 보유한 데이터라벨링 전문 기업
- 제한된 일정 내 최대한의 차량 이미지 데이터 수집과 가공이 필요한 상황에서 이를 수행할 수 있는 역량을 지닌 기업이라 판단
- 데이터 수집 이후 가공까지 진행되어야 하는 부분을 고려하였을 때, 데이터 처리 정확도 및 퀄리티가 중요한 프로젝트로 크라우드웍스의 결과데이터 정확도에 대한 신뢰를 가짐
- 고객사가 만족하는 데이터 개수별 정산을 통한 합리적인 비용: 협의된 수량에 따라 크라우드소싱 방식을 통한 데이터 수집 및 가공으로 고객사는 합리적인 단가를 제공받음
크라우드웍스 솔루션
작업자 선발
이번 프로젝트는 이미지 수집 작업 중 포토샵 활용을 통한 자동차 번호판 이미지 합성 작업이 필요한 프로젝트였습니다. 따라서, 작업자 선발과정에는 포토샵 활용에 대한 경험과 활용능력을 검증하기 위해 별도의 자격시험을 진행되었습니다. 자격시험의 내용은 고객사와 협의하여 구성되었고, 자격시험 결과에 따라 상위 점수 인원 리스트를 고객사에 전달하여 고객사가 직접 작업자를 선발할 수 있도록 했죠.
이미지 수집
(1) 차량의 번호판을 식별할 수 있는 이미지 데이터 수집
(2) 촬영된 이미지 내 적정 차량 대 수
이미지 내 존재하는 다수(최대 8대)의 차량들 중 1대만 번호판 식별이 가능하다면 데이터로 사용 가능
(3) 번호판 유형 분류
전체 데이터 중 70%는 일반 차량 번호판, 구형(10%), 운수형(10%), 전기차(10%) 비율로 구성
데이터 가공
(1) 이미지 내 “차량”과 “차량 번호판” 영역에 딱 맞게 바운딩 박스가 그려져야 함
(2) “차량 번호판”은 무조건 “차량”객체 영역 안에 있어야 함
(3) 라벨링 해야하는 객체가 가려져있지만 객체의 양 끝(좌-우 or 상-하)이 노출되어 있다면 하나의 객체로 바운딩 박스를 그림
(4) 라벨링 해야하는 객체가 가려져 있고 객체의 4면중 3면이 가려져 있다면 노출된 객체만 바운딩 박스를 그림
(5) “차량” 객체가 있지만 그에 매칭되는 “차량 번호판” 객체가 없더라도 “차량” 객체에 대해선 라벨링 진행
담당 PM 후기
이 프로젝트는 이미지 수집, 합성, 가공으로 이어지는 프로젝트로 합성을 진행한다는 점에서 기존 프로젝트와는 차별점이 존재했습니다. 그렇기에 합성 부분에 대한 걱정이 많았는데요. 하지만, 걱정과는 다르게 크라우드웍스의 41만명 작업자들 중 합성 작업의 어려움을 해소해줄 수 있는 능력자들이 계셨습니다. 작업자 본인 뿐만 아니라 그들의 지인 인맥을 동원하여 포토샵 관련 직업을 가진 작업자와 전공자들을 구할 수 있었으니까요! 크라우드웍스에겐 국내 최대 규모의 든든한 작업자가 있다는 사실이 이렇게 든든할 줄은 몰랐습니다. 저도 저희 고객사도요!