프로젝트 성공사례#16 학습 문항 데이터 데이터베이스화를 위한 PDF 문서 가공기
학습 문항 데이터 DB화를 위한 PDF 문서 가공기
학습 문항 데이터 OCR 및 POC 작업기
고객사 요구사항
- 고객사 OCR Tool + 크라우드웍스 플랫폼 연동
- 작업물 검수 작업 프로세스 공유 (작업 – 검수 – 결과값)
- 학습 문제 문항(시험문제 PDF) OCR 작업 / 검수 / 과목 별 결과물 납기
- POC(Proof of Concept) 프로젝트를 통해, 다양한 문제점 확인 / 조정
고객사에게 어떤 어려움이 있었나요?
고객사는 에듀테크 관련 OCR 툴을 가지고 있으나, 대량의 OCR 작업에 필요한 검수 기능, 검수 관리 기능 및 인력 등이 부족했습니다. 하지만, 고객사는 솔루션 제공 업체이기에 검수 문제와 관련한 기능 개발이 어려웠고, 기능 개발을 하더라도 운영에 대한 프로세스가 없어 근본적인 문제 해결이 불가능한 상황이었습니다.
크라우드웍스를 선택한 이유!
- 검수 관련 프로세스(검수 기능/검수 관리/작업자 관리/인력 등)를 전문적으로 관리하고 있는 플랫폼 회사
- 전문 PM을 통해, 개발 리소스가 포함되는 프로젝트를 구체화 할 수 있는 역량을 가지고 있는 회사
- PoC를 함께 설계 및 진행하며 문제점을 파악하고, 더 나은 방향으로 본 프로젝트를 진행할 수 있는 회사
크라우드웍스 솔루션
OCR 전사 및 검수
고객사에서 제공해주신 각 과목별 학습 문제 PDF를 토대로, OCR 전사 및 검수 작업이 가능한 설계안을 구상하였습니다. 해당 설계안을 바탕으로, 고객사 OCR 툴과 크라우드웍스의 툴 작업 화면을 연동하는 개발 작업이 진행되었습니다.
1, 2차 POC 프로젝트 진행
AI 프로젝트를 진행할 때 개념 실증이라 불리는 ‘PoC(Proof of Concept)’ 작업은 개발하려는 시스템의 컨셉이 정말 실현 가능한지 검증하는 작업입니다. 크라우드웍스는 고객사와 POC 프로젝트를 함께 설계 및 진행하며 문제점을 파악하고, 더 나은 방향으로 해당 프로젝트를 진행시키기 위해 노력했습니다. POC 프로젝트는 1차, 2차 프로젝트로 나누어 진행되었는데요. 1차에는 국어/수학/사회 과목에 대한 개별 난이도 태깅/OCR/메타 확인 및 편집 작업 및 검수를 그리고 2차에는 동일한 세 과목에 대한 난이도별(최상-상-중-하) OCR 편집 및 메타 태깅 및 검수를 진행했습니다.
작업자와 검수자 선정에 있어서는 사전 작업시험을 통해 30명의 작업자와 검수자를 선발했습니다. 또한, 검수 배지가 있는 대상자만 최종 검수 작업에 참여가 가능하게 하여 검수 퀄리티를 높이도록 설계했습니다.
POC 취지에 맞게 담당PM은 진행 간 발생한 다양한 오류(툴 연동으로 인한 오류, 작업 및 검수간의 오류 등)를 분석하여 결과보고서를 제출했습니다. 고객사는 해당 POC 프로젝트 및 결과보고서를 바탕으로, 더 많은 문제 수량을 안정적으로 작업할 수 있는 설계안을 마련할 수 있었습니다.
담당 PM 코멘트
“해당 POC 프로젝트는 PM을 비롯한 크라우드웍스 내의 플랫폼팀, PI팀(Project Improvement), TA팀(Talent Acquisition), 영업팀 등 다양한 관련 부서가 함께 힙을 합쳐 진행되었기에 성공적으로 끝마칠 수 있었던 것 같습니다. 또한 플랫폼 연동 부분에 개발 리소스가 투입되는 프로젝트를 맡아 처리해야 할 이슈들이 많았지만, 고객사에서 원하는 높은 품질의 결과 값을 빠른 기간 내에 뽑아낼 수 있어 뿌듯했습니다.”