[대표님이 그랬어요 02] 인간을 끊임없이 필요로 하는 AI

“인공지능(AI)은 스스로 학습할 수 없기 때문에 많은 양의 학습 데이터를 필요로 합니다. 수십, 수만 개의 데이터 가공 작업에는 사람이 동원됩니다. 결국 AI 시대에도 사람이 핵심입니다.”

인공지능 학습의 관건은 필요한 데이터를 정해진 형태로 얼마나 빨리 제공할 수 있느냐에 달려있습니다. 크라우드웍스의 플랫폼은 AI 기업들의 이런 고민을 크라우드 방식으로 해결하고 있다는 것이 강점입니다.

크라우드웍스는 국내 최초로 AI 데이터 라벨링 프로젝트에 일반 대중을 참여시켰습니다.

기업이 인공지능을 활용하는 모든 과정에서 최적화된 데이터 솔루션을 제공하며, 일찍이 사람의 중요성을 강조해왔죠. 그 결과 50만 명에 달하는 국내 최대 작업자 풀과 함께 현재까지 2억 개 이상의 데이터를 가공했습니다.

작업이 고도화되고 복잡해질수록 인간의 지속적인 피드백은 인공지능 학습의 필수적인 영역이 됩니다. 의료나 법률 지식 같은 전문 지식이 필요하며, 기계가 판별할 수 없는 특수 케이스에 대한 라벨링, 복잡도가 높은 라벨링 등의 수요가 증가하기 때문이죠.

업계 내 뜨거운 화제를 불러일으키며 생성AI의 새로운 지표를 연 챗GPT도 인간의 피드백을 반영한 데이터를 학습했습니다. OpenAI는 Scale AI, Labelbox, Amazon Mechanical Turk 등 데이터 파트너와 협업하며 AI가 데이터를 학습하는 과정에서 데이터 라벨러의 도움을 받았습니다. 이렇게 인공지능 모델의 학습에 인간의 피드백을 활용하는 방식을 인간 피드백 기반 강화학습(Reinforcement Learning from Human Feedback, RLHF)이라고 합니다. 챗GPT는 RLHF 방식을 활용하면서부터 자가학습을 통해 모델을 학습했던 2022년 이전에 비해 모델의 안정성과 정확도를 빠르게 개선할 수 있었습니다.

하지만, 인공지능을 위한 데이터를 처음부터 끝까지 사람에게 의지할 순 없죠. 그래서 크라우드웍스는 높은 품질을 구현하면서도 작업을 더 편리하게 만들기 위한 기술들을 지속적으로 개발하고 있습니다. 현재는 가공 작업의 난이도를 낮추는 분산병렬처리 기술과, 스마트 라벨링 기술 등을 사용하고 있으며, 체계적인 검수를 위한 시스템들을 운영하고 있습니다.

크라우드웍스는 ML기반 솔루션, 그리고 인공지능의 교사인 ‘인간’과 함께 양질의 데이터를 생산하고, AI 기업에 필요한 모든 솔루션을 제공합니다. 인공지능을 궁극적으로 사용하는 ‘인간’이 더 편리하고 유익한 생활을 하기 위한 크라우드웍스의 고민은 계속됩니다.

크라우드웍스는 데이터 중심의 인공지능 기술을 통해 사람과 인공지능이 함께 성장하는 새로운 미래를 만들어갑니다.

Leave a Comment