“Workstage가 가장 적합한 솔루션!” – S 보험사 AI 학습 데이터 구축기

프로젝트 성공 사례

고객사 S는,

1952년에 설립된 국내 최대 손해보험사로 S그룹에 속해 있으며 자동차보험, 화재보험, 건강보험, 여행자보험 등 다양한 보험 상품을 제공하며 개인 및 기업 고객 대상으로 폭넓은 서비스를 지원하고 있습니다.

프로젝트의 시작

보험 산업은 복잡한 약관과 다양한 상품 정보를 효율적으로 관리하고 고객에게 제공하기 위해 다른 어떤 산업군보다도 더 적극적으로 AI를 활용하고 있습니다. 고객사 S사는 전통적인 업무 방식을 고수해 왔던 일반보험 관련 업무에 AI 기술 및 데이터 기반 업무 프로세스를 도입해 업무 효율을 높이고자 했습니다. 이에 내부 직원용 AI 챗봇을 구축하기로 했고 이에 앞서 학습 데이터 구축 및 데이터 자산화를 위해 방대한 일반보험 약관 문서 등을 전처리하는 프로젝트를 크라우드웍스와 진행하게 됐습니다.

크라우드웍스의 역할은요

  • 요구사항 정의 등 기업에 꼭 필요한 컨설팅을 진행합니다.
  • PPT, PDF 등 다양한 형태의 약관 문서를 데이터 전처리 가이드에 맞게 분류 및 구조화하고 AI 학습에 적합한 형태로 변환합니다.
  • 다양한 유형의 데이터 라벨링 작업, 고객사 필요에 따라 자유롭게 사용할 수 있는 어노테이션 도구 및 작업 화면 템플릿 제공, 대시보드를 통한 실시간 모니터링 등 데이터 프로젝트 전 과정을 쉽고 편리하게 관리할 수 있는 올인원 솔루션 ‘Workstage’을 사용해 데이터를 전처리합니다.
  • 손해사정 보고서 등 외부 반출이 불가한 문서의 경우 고객사 내에 직접 Workstage 온프레미스 (On-premise) 솔루션을 설치하고 전문 작업자와 함께 데이터를 구축합니다.
  • 크라우드소싱을 통해 보험 데이터 전처리 프로젝트에 경험이 있는 전문 작업자를 모집하여 팀을 꾸리고, 데이터 구축 효율성을 극대화할 수 있는 표준화된 데이터 프로젝트 프로세스에 따라 체계적으로 업무를 진행해 데이터의 일관성을 유지하고 고품질의 데이터를 구축합니다.

S사가 크라우드웍스 Workstage 온프레미스를 선택한 이유

  • 보안성이 뛰어나요
    “손해사정 보고서 등 개인 정보가 일부 포함된 문서 및 외부로 반출할 수 없는 대외비 문서를 다루는 프로젝트 특성상 사내 작업 환경 구축이 필수였는데요. 이 때문에 사내에 설치가 가능하면서도 보안이 철저한 데이터 솔루션이 필요했습니다. 그래서 크라우드웍스 Workstage를 선택해 사내에 설치하고 작업을 수행했는데요. 데이터 유출 걱정도 덜고, 자사 보안 정책에 맞춰 프로젝트를 진행할 수 있었습니다.”
  • 다양한 문서 형식에 대응이 가능해요
    “PDF, DOCX 등 다양한 포맷의 문서를 전처리함에 따라 그에 맞는 데이터 작업이 필요했는데요. Workstage에서 제공하는 다양한 어노테이션 툴을 활용했고, 몇 번의 클릭으로 작업 템플릿을 선택하고 원하는 작업 환경으로 구성해 효율적인 데이터 작업을 진행할 수 있었습니다.”
  • OCR 활용으로 데이터 작업 효율을 크게 높였어요
    “텍스트 복사 및 붙여넣기가 불가능한 형태의 문서도, Workstage에 탑재된 OCR 기능을 통해 텍스트를 바로 추출하고 어노테이션 도구를 활용해 작업할 수 있어 시간을 단축시킬 수 있었습니다.”
  • 프로젝트 관리와 모니터링이 용이해요
    “프로젝트를 관리하는 입장에서 여러 사람이 참여하는 만큼 프로젝트 진행 상황을 실시간으로 체크하는 것도 중요했는데요. 일별 진척률 및 실시간 모니터링 기능을 통해 프로젝트 진행 상황을 효과적으로 관리할 수 있었습니다. 작업 내용과 검수 상황을 실시간으로 확인할 수 있어, 잘못된 작업 발생 시 조기에 포착하고 피드백을 해 수정에 드는 리소스를 줄일 수 있습니다.”

Drag&Drop으로 손쉽게 구성하는 작업 화면

데이터 프로젝트 실시간 모니터링 대시보드

Workstage로 구축된 AI 학습데이터 예시

  • 약관 문서를 Parsing 후 Text를 추출하고, 데이터 프로세싱을 통해 추출된 Text를 구조화합니다. 구조화된 CSV 형태를 검수를 통해 JSON 형태의 데이터로 구축합니다.

Workstage를 통한 약관 문서 작업 화면 예시

  • Workstage 내에 탑재된 Markdown editor로 문서 영역을 박스 처리하면, 영역 내 텍스트를 자동 추출할 수 있습니다.

프로젝트를 마치며

S사의 방대한 보험 문서 중에서도 손해사정 보고서는 매년 약 2만 5천 건이 발생하지만, 대부분 디지털화가 되어 있지 않고 개인 정보가 포함되어 있어 AI 학습용 데이터로 활용하기 어려운 상황이었습니다. S사는 크라우드웍스의 Workstage로 전처리한 데이터로 이러한 문제를 해결하고, 이를 바탕으로 AI 챗봇을 통한 보상 응대, 일반보험 약관 문서의 데이터 자산화, AI 기반 키워드 추출을 통한 심사 및 보상 업무 등 다양한 분야에서 활용할 예정입니다.

이번 프로젝트는 S사 TF팀과 긴밀한 협력을 통해 진행되었으며, 담당자는 크라우드웍스의 결과물에 만족하여 이후에도 다른 프로젝트에 Workstage를 적극 활용하겠다는 긍정적인 반응을 보였습니다. 

더불어 민감한 기업 데이터를 외부로 반출하지 않고도 손쉽게 데이터를 수집, 가공, 검수할 수 있는 Workstage 온프레미스 솔루션은 현재 국방, 금융, 보험, 제조업 등 여러 산업에서 활발히 도입하고 있으며, 솔루션에 대한 문의 역시 꾸준히 증가하고 있는데요.

이번 프로젝트 사례를 보고 Workstage 활용에 관심이 생기셨다면, 도입에 대해 크라우드웍스 전문가와 바로 상의해보시면 어떨까요?