프로젝트 성공사례#20 피아노 연주 분석 및 개선점 제공 모델 개발을 위한 음성 수집∙가공기
피아노 연주 분석 및 개선점 제공 모델 개발을 위한 음성 수집∙가공기
피아노 연주 평가 및 가공기
고객사 요구사항
- 고객사가 제공하는 115건의 피아노 연주 음성 파일(wav)을 대상으로 작업 진행
*wav 파일: 두 곡에 대한 음원을 8마디(또는 16마디)씩 쪼갠 결과; 파일 1개의 평균 길이는 약 10초 (단, 범위는 3초~1분까지 다양) - 작업자는 주어진 화면에서 ‘연주’ 자체에 대한 평가 진행(악곡 자체 특성이 아닌 연주자의 해석과 표현에 대한 응답 제공)
고객사에게 어떤 어려움이 있었나요?
본 프로젝트 수행을 위해서는 음악적인 기본 소양 및 전공 등 아래와 같은 자격조건을 충족하는 작업자 구인이 필요하였습니다. 고객사는 이러한 자격 조건을 충족하는 작업자 구인에 애로사항 및 어려움을 겪고 있었을 뿐만 아니라 전문성을 가지고 프로젝트를 운영해줄 전문 기업을 찾던 중 크라우드웍스를 알게되어 필요한 자격조건을 충족하는 작업자 구인 및 프로젝트 운영까지 모든 고민을 한번에 해결할 수 있었습니다.
크라우드웍스를 선택한 이유!
- 까다로운 자격 요건을 충족하는 다수의 작업자 구인 한번에 해결 가능
- 자격요건 증빙서류 제출을 통해 작업자의 자격요건에 대한 신뢰 형성
- 크라우드웍스 자체 플랫폼 이용 및 설계를 통한 효과적인 개발 리소스 절감
- 작업자의 나이, 성별, 직업 군, 최종학력, 다루는 악기 여부 등 여러 메타데이터 획득 가능
크라우드웍스 솔루션
작업자 선발
자격조건:
1. 실연자(악기/성악) : 대학원생 이상(재학증명서/졸업증명서) or 프로 연주자(2년 내의 본인이 참여한 공연 포스터(졸업연주, 오케스트라 등 모든 종류 포함), 예술인패스 등으로 증빙 필수)
2. 음악이론 관련 전공(작곡/이론 전공) : 대졸 이상 (졸업증명서)
해당 프로젝트는 작업자 자격조건 확인을 위해 별도 서류 증빙(졸업증명서 등)을 요구했습니다. 크라우드웍스는 작업자의 입장에서 어떠한 형태의 자료 증빙이 더 편리할지 내부 TA(Talent Acquisition)팀의 의견을 구하고 고객사와 조율하여 작업자 선발을 진행했는데요. 이때, 작업자의 전공, 다루는 악기 등의 메타데이터 수집 또한 함께 이루어졌습니다.
자격요건에 대해서는 고객사와 아래와 같이 최종 협의했습니다.
아래 중 최소 1가지 조건을 충족하는 자:
- 연주자 : 최근 3년 내 본인이 공연한 포스터/영상 등을 통해 증빙이 가능한자
- 전문대 졸업자 : 최근 2년 이내 순수음악과 등 음악관련 전공 및 졸업자
- 4년제 대학 : 음악학, 기악, 성악 등을 전공한 자
- 대학원생 및 기타 : 모든 음악 관련학과 재학 및 전공자
이번 프로젝트는 음악을 듣고 작업자가 느끼는 감정이 밝아지는지 또는 어두워지는지, 곡의 분위기가 몽상적인지 또는 산문적인지, 다이내믹의 폭이 큰지 또는 작은지 등 음악에 대한 작업자의 해석에 대한 설문을 답변하는 작업이었습니다. 따라서, 작업 이후 별도의 검수를 두지 않고 작업자 개개인의 의견을 곧 결과 데이터로 정의 및 활용했는데요. 작업의 결과물은 단순한 설문 조사 결과 자료로 보일 수 있겠지만, 인간의 인식으로 산출된 선택값이 아니라 인간의 이해로 만들어진 작업물이었기에 일반적인 오디오 데이터 가공 프로젝트와는 또다른 특수한 경우였습니다.
음성(피아노 연주 영상) 평가
피아노 연주 영상을 평가하는 과정에서 작업자들이 듣게되는 소스 음원은 동일하지만 그들의 집중도에 따른 평가의 차이를 확인하기 위해 담당PM은 작업자들을 A그룹과 B그룹으로 나눠 AB테스트를 진행했습니다.
- A그룹 할당 수량 2,230건(N명)
- B그룹 할당 수량 1,150건(10명; 1명당 115건 작업)
프로젝트 오픈과 동시에 각각의 A, B 그룹에서 작업자를 선정해 평가를 진행했는데요. 고객사가 가장 만족할 수 있는 결과데이터를 생성해내기 위해 1차 오픈의 결과물을 고객사에 전달하여 피드백을 받는 과정을 거쳤습니다. 고객사의 피드백을 반영하여 일부 수정사항을 적용하기 위해 프로젝트 재오픈을 진행하기도 하는 등 유연한 대처를 선보였습니다.
담당 PM 코멘트
“데이터 구축 산업에서는 다양한 데이터를 다루게됩니다. 다양한 데이터를 인간의 감각으로 인식해 사과가 담긴 사진에 ‘사과’라는 레이블을 달아주는 판단 작업을 하는게 저희의 주된 일이 아닐까 싶습니다. 그러나, 이번 프로젝트에서는 일반적인 이미지/텍스트 데이터가 아닌 오디오 데이터 중 음악을 다루게 되었습니다. 참여해주신 작업자분들은 모두 음악에 일가견이 있으신 전문가분들이셨고, 관심과 열의를 보여주셔서 성공적으로 프로젝트를 마무리 할 수 있었습니다.
AI 산업 내에서는 자연과학, 의학, 법학 등의 전문적인 도메인에 대하여 다양한 연구가 시도되고 있고, 이에 맞춰 크라우드웍스에서는 다양한 도메인 전문가들과 함께 데이터 구축 사업을 수행하며 전진하고 있는 중입니다. 이와 마찬가지로 문화, 예술 분야에 대한 연구에도 크라우드웍스가 좋은 파트너가 될 수 있다는 자신감을 갖을 수 있는 계기였던것 같습니다.”