프로젝트 성공사례#11 국제무역사 자격시험 문항 전사 가공기
국제무역사 자격시험 문항 전사 가공기
고객사 요구사항
- 초기 1회차 작업 완료 시, 샘플 납기 및 양 사 검수 진행
- 결과물 : 구글 스프레드시트로 납기 희망
- 최고의 OCR 퀄리티
고객사에게 어떤 어려움이 있었나요?
저희는 현재 오프라인으로 진행 중인 국제무역사 자격시험을 온라인으로 전환하려는 계획을 가지고 있었습니다. 온라인으로 시험을 전환시켜 기존 연 1-2회이던 시험을 월 1회로 늘리려는 계획이었지만, 자격시험 문항 출제자들에게 PDF를 이용한 문제 출제는 속력을 내는데에 크나큰 걸림돌이었죠. 이에 문제 은행에 대한 필요성을 인식하였지만, 데이터라벨링 의뢰를 해 본 적이 없어 어떻게 해당 프로젝트를 설계/운영할 지에 대해 컨설팅이 필요했습니다.
크라우드웍스를 선택한 이유!
- 초기 컨설팅 제공 – 다양한 레퍼런스와 경험을 바탕으로, 고객사의 니즈 확인부터 프로젝트 방향 설정, 설계까지 서포트해준다는 점이 마음에 들었습니다.
- 프로젝트 진행 중 담당PM과의 원활한 커뮤니케이션이 가능하다는 점과 프로젝트 샘플 및 중간 납기를 통해 사전 퀄리티를 확인할 수 있다는 점이 매우 좋았습니다.
- 가공과 검수를 통한 데이터 퀄리티에 안심하게 되었습니다.
작업 설계
온라인으로 전환시켜 기존 연 1-2회이던 자격시험을 월 1회로 늘리려는 계획을 수행하기 위해서는 빠른 문제 출제가 관건이었습니다. 하지만, 고객사에서 기존에 활용하던 PDF 파일으로는 빠르게 문제를 출제하는 것에 한계가 있었습니다.
이에 크라우드웍스는 고객사가 보유한 전체 회차의 PDF 문항을 OCR 전사하고, 이를 태깅값에 맞춰 문제은행화하여 보다 빠르고 정확한 문제 출제가 가능하도록 프로젝트를 설계했습니다. 기존의 다양한 레퍼런스를 바탕으로, 문제 은행 구축에 대한 초기 설계 및 구글 스프레드시트 양식으로의 OCR 전사를 제안 드렸고 프로젝트를 맡겨 주셨죠.
데이터 라벨링 프로젝트를 처음 진행하는 고객사였기에, 니즈 확인부터 프로젝트 구체화, 설계, 계약, 작업가이드 구성 그리고 진행까지 전체적인 작업 컨설팅을 희망하셨는데요. 여러번의 초기 미팅을 통해, 문제은행 시트를 구체화하는 것으로 조율했고. 스프레드시트 맨 앞에 엑셀 대시보드를 구축하여 태깅된 항목에 맞춰 원하는 문제 유형을 빠르게 검색할 수 있도록 결과 데이터를 구성했습니다.
시험 문항 전사 과정
국제무역사 자격시험은 난이도가 높고, 1개의 자격시험 진행 시 각 50개씩의 문제들로 구성된 4개의 과목에 대한 시험이 진행됩니다. 이에 따른 특수 유형들이 많아 프로젝트 진행 중 다양한 영역에서의 가이드 설정이 중요했습니다. 예를 들면, 단순 문제 표가 아닌 국제 송장 등의 표를 어떻게 처리할 것인가? 등에 대한 가이드가 필요했는데요. 전사가 어려운 표는 이미지 자체 캡쳐로 저장하는 등 각 상황에 맞는 상세한 가이드를 작성했습니다. 또한, 추가로 원본 데이터(PDF)의 문제 유형 및 해설 유형이 다른 회차들에 대해서는 가이드 설정과 태깅값 설정을 역으로 제안하는 등 운영하는 동안 강도 높은 고객사 커뮤니케이션을 진행했습니다.
담당 PM 코멘트
“크라우드웍스의 고도화된 플랫폼 덕분에 작업자가 언제 어디서나 자유롭게 일할 수 있도록 프로젝트를 구성할 수 있었습니다. 큰 작업을 쪼개서 여러 명의 작업자에게 배분하여 다수의 작업자가 동시에 한 pdf 문서를 보고 작업할 수 있도록 설계 하였습니다. 이렇게 작업 자체의 난이도는 낮추면서도 고객이 원하는 수준 높은 결과 데이터를 빠른 기간 내에 추출할 수 있었습니다. 이번 프로젝트는 크라우드웍스만의 플랫폼과 PM 업무 지원을 위한 내부 툴이 강력하다는 것을 느끼게 된 계기였습니다. 첫 데이터 라벨링 프로젝트를 시작하며 여러가지로 고민이 많던 고객사가 결과 데이터를 받고 뿌듯해하는 모습을 보면서 저도 제 일처럼 뿌듯했습니다.”