LLM 장인은 숲보다 나무를 먼저 본다 [스토리팩-크라우드웍스 ②]
Writer 이건한 기자 | 디지털데일리
해당 콘텐츠는 디지털데일리 테크콘텐츠랩의 ‘스토리팩’에 연재된 기사입니다. ‘스토리팩’은 혁신기업들의 주요 기술·인재·조직 키워드를 책 읽는 듯한 재미와 인사이트로 전달하는 기업별 연재 기획물입니다. |
“LLM(거대언어모델), 그거 사실상 만능 아닌가요?” 요즘 AI 시장에서 LLM이 워낙 화제라 이런 오해가 생각보다 많죠. 심지어 조직 내에 LLM 도입 니즈가 있는 대기업 관계자들도 이와 비슷한 질문을 할 때가 있다고 합니다. 기업의 크고 작음과 최신 AI 기술 및 트렌드에 대한 이해는 완전히 ‘별개’란 이야기죠.
“LLM 도입과 전략 설계를 도와드립니다.” 상황이 이렇다 보니 요즘 B2B(기업간거래) AI 시장에선 이런 메시지로 영업하는 회사들도 어렵지 않게 찾아볼 수 있습니다. 일종의 컨설팅 비즈니스입니다. 그런데 기업의 LLM 도입을 잘 도와준다는 건 무슨 기준으로 판단해야 할까요? 단순히 LLM 개념과 활용법에 대한 교육, 기술지원을 약속하는 수준으로 한정 짓기엔 아쉬운 감이 있습니다.
크라우드웍스는 양질의 LLM 컨설팅이란 ‘고객사 데이터에 대한 깊은 이해를 바탕으로, LLM이 정답을 제시할 수 있도록 만드는 모든 설계와 지원 과정’이 포함되어야 한다고 말합니다. 이는 LLM이 ‘허튼소리’를 하지 않도록 가장 밑단의 데이터부터 최적화할 수 있는 역량을 말하기도 합니다. 다른 의미로 LLM은 숲(모델)보다 나무(데이터)를 먼저 보는 접근이 더욱 완성도 높은 결과물을 만들어낼 수 있다는 뜻이기도 하죠.
LLM, 그게 뭔데?
이를 이해하려면 우선 LLM의 구조와 능력, 한계 등을 알아야겠죠. LLM은 ‘대형언어모델’이란 이름처럼, 쉽게 말해 ‘사람처럼 읽고 쓸 수 있는 법을 배운 인공지능’입니다. 자신이 학습한 데이터 영역에 대해서는 무엇을 물어봐도 사람처럼 그럴듯한 답을 만들어낼 수 있는 특징이 있죠. 또한 그 영역이 글쓰기, 이미지 및 영상제작, 번역 등 워낙 다양하다보니 세간에선 LLM이 영화 아이언맨에 나오는 초고성능 AI ‘자비스’처럼 뭐든 해낼 수 있는 ‘강(强) 인공지능’의 초기 형태가 아니냔 평가가 나오기도 합니다.
하지만 LLM은 아직 사람과 같은 자아가 있다고 말하긴 어렵습니다. 앞서 ‘그럴듯한 답’이라고 쓴 표현에 집중해 주세요. 현세대 LLM이 답을 생성하는 원리는 대개 방대한 학습 데이터에서 특정 패턴을 찾아낸 뒤, 사람이 보기에 가장 그럴싸한 데이터를 연결하는 방식입니다.
챗GPT 발췌
이때 만약 “학교 종이”라는 입력이 들어오면 일반적으로 “땡땡땡”을 떠올려 붙일 수 있겠죠? 그런데 정작 ‘학교 종이 땡땡땡’이란 전체 문장의 의미나 감성을 LLM이 사람처럼 알진 못한다는 겁니다. 여기서 문제는 LLM의 목적은 결국 ‘어떻게든 답을 만들어내는 것’입니다. 이 때문에 종종 없는 이야기를 사실처럼 꾸며서라도 답을 만드는 ‘할루시네이션(Hallucination), 즉 ‘AI 환각현상’이 일어나는 거죠. 중요한 건 AI의 신뢰성을 깎아 먹는 이런 환각현상, 혹은 품질이 떨어지는 답변도 구조적으론 결국 학습 데이터에 큰 영향을 받는다는 점입니다.
결국 이런 구조와 원리를 명확히 이해하지 못한 상황에서 LLM을 도입, 서비스에 적용하려 한다면 제아무리 많은 데이터를 보유한 대기업이라도 LLM이 ‘정답’을 말하게끔 만드는 건 쉽지 않은 문제가 됩니다. 또한 LLM이 산업 현장에서 주목받은지 그리 오랜 시간이 지나지 않았기 때문에 아직 관련 전문가가 부족한 점도 하나의 원인입니다.
모든 AI의 밑바탕은 ‘데이터’
이런 배경으로 크라우드웍스엔 지난 2023년 상장을 기점으로 기존 AI 학습용 데이터 가공 사업 외에, LLM 도입에 관한 문의가 점점 증가하고 있다고 합니다. 크라우드웍스도 이런 변화에 발맞춰 사업 포트폴리오를 LLM 컨설팅 방면으로 발빠르게 확대하고 있죠.
다만 이 과정에서 발견한 맹점은 대부분의 경쟁사가 기존 LLM을 파인튜닝(Fine tunning, 미세조정)해 제공하는 수준에서 고객 요구사항에 대응할 뿐이었단 것입니다. 이게 크라우드웍스 입장에선 “데이터에 대한 고민 없이 어떻게 좋은 LLM을 만들지?”란 의아함이 따랐던 대목입니다. 딥러닝이든, 앞서 설명한 LLM이든 결국 모든 AI의 밑바탕은 데이터니까요. 한마디로 똑똑한 뇌를 만들고 싶다면서, 어떤 정보를 학습할지는 고민하지 않고 뇌세포와 신경만 개조하는 것과 다르지 않아 보였을 것입니다.
이에 크라우드웍스는 자신들의 전문 분야인 데이터를 근간으로, LLM이 각 기업에게 필요한 ‘정답’을 말할 수 있도록 돕는 것을 자사의 전략적 지향으로 결정했습니다. 그것이 본질적으로 옳은 LLM의 역할이자, 사업에서도 경쟁사들과 확실한 차별화가 가능한 부분이라 판단했기 때문이기도 합니다.
파인튜닝 데이터 프레임워크
이런 이유로 크라우드웍스가 개발한 것이 바로 ‘파인튜닝 데이터 프레임워크’입니다. 고객사가 요구하는 AI 모델이 제대로 동작하게 만듦에 있어 ‘적합한 데이터 생성 방안’부터 제시하기 위함인데요. 실제로 크라우드웍스의 파인튜닝 데이터 프레임워크는 고객 요구사항에 따라 ▲파인튜닝용 데이터를 어떻게 생성해야 하는지 ▲어떤 데이터로 테스트해야 하는지 ▲테스트 결과에 따라 모델을 수정하려면 어떤 데이터가 필요한지를 제시하는 것이 핵심 기능입니다. LLM 구축에 앞서 불필요한 데이터는 배제하고 가장 정답에 근접한 데이터를 먼저 추리는 과정이죠.
‘파인튜닝 데이터 프레임워크’ 개요
이와 비슷하지만 다른 개념으론 최근 주목받는 ‘RAG(검색증강생성)’가 있습니다. 일종의 전문지식이 담긴 외부 데이터베이스(DB)입니다. 가령 범용 LLM에 “오늘 날씨가 어때”라고 물으면 모델은 자신이 학습한 데이터를 중심으로 답변할 텐데, 이 정보는 이미 낡은 것일 수도 있습니다. 이때 RAG 설계로 외부 날씨 정보 제공 사이트를 우선 참조하도록 하면 해당 LLM은 날씨 분야에선 보다 정확한 정보를 제공할 수 있겠죠. 나름 신뢰할 수 있는 DB를 참조하도록 한다는 점에서 특정 분야의 할루시네이션을 줄이는 방법으로도 이야기됩니다.
그러나 단점도 있습니다. 참조하는 외부 DB가 반드시 옳은 데이터만 갖고 있지 않을 수 있고, 외부 데이터를 처리하는 과정에서 설계가 복잡해지며 처리 속도가 느려집니다. 이는 곧 연산비용의 증가로도 이어지죠. 할루시네이션을 줄이는 데 도움이 될지는 몰라도 단점 또한 명확하다는 이야기입니다. 이보다 이상적인 건 RAG를 최대한 덜 활용하도록 초기 단계부터 정확하고 필요한 데이터만 잘 추리는 방법인데요. 파인튜닝 데이터 프레임워크가 바로 이 부분에 도움을 줍니다.
물론 RAG가 더 효과적일 때도 있습니다. 때론 프롬프트 엔지니어링(AI 명령어 설계)을 통해서도 LLM이 더 나은 정답을 말하도록 만들 수도 있죠. 중요한 건 이 가운데 주어진 상황에 가장 적합한 방법론을 찾아 적용할 수 있는 안목입니다. 이 모두 데이터의 특성을 잘 알아야 가능한 일이며, 태생부터 데이터 전처리 전문회사로 성장해 온 크라우드웍스는 자신들이 이 부분에서 누구보다 뒤지지 않을 거라 자신하는 이유였습니다.
실제로 크라우드웍스에선 모든 프로젝트에서 ‘사전 컨설팅’에 가장 많은 시간을 할애한다고 설명했습니다. 고객의 요구사항을 정리하고, 그들이 보유한 문서와 데이터를 분석하고, 이 안에서 메타데이터(Meta data)를 구성하는 과정이죠. 메타데이터는 ‘데이터를 위한 데이터’로 설명됩니다. ‘책’을 예로 들면 데이터는 책의 내용, 메타데이터는 ▲제목 ▲저자 ▲출판사 ▲출판연도 등의 상세 데이터죠. 메타데이터가 잘 정리돼 있는 DB에선 원하는 책을 더 쉽고 정확하게 찾을 수 있을 것입니다.
마찬가지로 LLM을 위한 데이터도 이 과정이 정교하게 진행되어야 모델이 한정된 데이터에서 더 알맞은 답을 쉽게 추려낼 수 있게 되는 것과도 같습니다. 다양한 데이터 처리 역량도 필수죠. 이에 대해 크라우드웍스 관계자는 “기업 데이터의 80%가 HTML, PDF, CSV, PNG, PPTX 파일 등 기계가 이해하기 어려운 형태로 존재한다”고 말했는데요. 이 같은 데이터들을 손쉽게 추출하고, 모든 LLM 프레임워크에서 사용할 수 있도록 크라우드웍스는 ‘놀리지 컴파일러(Knowledge Compiler)’ 솔루션도 자체 개발해 활용 중입니다. 이를 통해 RAG용 데이터 전처리를 더욱 꼼꼼히 수행하면서 기업 내 존재하는 다양한 문서도 AI 친화적으로 변환할 수 있다고 합니다.
기업을 위한 sLLM, 웍스원
크라우드웍스는 자체 기술로 개발한 경량화 거대언어모델(sLLM), 웍스원(WorksOne)도 보유하고 있습니다. 이들 설명에 따르면 ‘기업환경에 최적화된 LLM’이죠. 현재 시장을 주도하는 LLM은 오픈AI의 ‘GPT’, 메타의 ‘라마(Llama)’ 등입니다. 하지만 이들 모델은 영어 중심으로 학습되어 한국에서 통용되는 전문적인 비즈니스 용어를 원활히 이해하지 못하는 단점이 있습니다. 이는 데이터와 또다른 문제로, 앞서 데이터가 잘 갖춰져도 필요한 데이터를 제대로 학습한 모델이 갖춰지지 않으면 결국 좋은 성능을 내기 어려운 부분이기도 합니다. 웍스원은 크라우드웍스가 이 문제를 직접 해결하기 위한 노하우를 집약해 만든 모델이죠.
특징을 살펴보면 철저한 기업형 LLM로 개발된 점이 눈에 띕니다. 기본적으로 ‘금융’, ‘유통’, ‘공공기관’ 등 고객사별 도메인에서 자주 사용하는 표현을 비즈니스 형상에 맞춘 1만여개의 고품질 데이터가 학습에 사용됐는데요. 특히 여기엔 평군 15년 이상, 대기업 기획 업무 경험을 지닌 고급 데이터 작업자들이 ▲비즈니스 언어 활용과 표현력 ▲문서 구조화 능력 등에 대한 자체 검증을 실시한 결과물만 데이터만 포함돼 있습니다. 크라우드웍스에 따르면 전문가가 직접 만든 한국어 데이터로 학습시킨 모델은 국내에서 웍스원이 유일하다고 하죠.
데이터 전문가 검수, 한국 기업환경 및 비즈니스 용어에 특화된 sLLM 웍스원
이 같은 데이터 구성으로 웍스원은 비즈니스 자연어 처리에 대한 오답률이 기본적으로 낮은 편입니다. 더불어 일반적인 기업 내부 시스템과의 연동도 원활하도록 지정한 키(Key) 값과 구조를 갖춘 제이슨(JSON) 형식의 답변을 안정적으로 출력할 수 있게 설계됐습니다. 다양한 사내 레거시 시스템과의 통합 및 확장성에 중점을 둔 이 설계는 웍스원의 비즈니스 활용성을 극대화하는 요소이기도 합니다.
말비계가 뭔지 아세요?
예시를 하나 들어볼까요. 대기업 ‘S사의 연구소가 의뢰한 ‘건설·조선업 특화 AI 통역앱’ 개발 의뢰는 크라우드웍스가 강조한 ‘데이터 중심으로 정답을 제시하는 LLM 컨설팅’의 전반적 노하우가 잘 묻어난 사례 중 하나로 꼽힙니다.
전자의 요구사항은 “건설, 조선업 현장의 어려운 용어를 정확히 통역하는 다국어 AI 통역 앱을 만들고 싶다”는 것이었습니다. 2022년 기준 국내 건설·조선업 현장의 외국인 근로자는 약 10만명 이상으로 추산되며 계속 증가하는 추세인데, 소통 문제에 기인한 안전사고 또한 계속 늘어나는 상황이었습니다. S 그룹사 건설현장은 이 문제를 줄이고자 여러 언어로 소통이 가능한 통역 앱도 현장에 도입했으나 여의치 않았죠. 보통의 앱은 건설 전문 용어를 현장 의미와 다르게 오역했기 때문이었습니다.
예컨대 ‘말비계를 설치하고 작업을 시작해 주세요’에서 말비계란 단어를 보통의 번역앱은 ‘horse scaffolding’라고 직역하는 식이었죠. 본래 말비계란 건축현장에서 쓰이는 낮은 높이, 비계 형태의 발판을 의미하는데 관련 데이터를 학습하지 못한 까닭이었습니다. 또 한가지 문제는 해당 연구소도 요구사항에 걸맞은 데이터를 충분히 보유하고 있지 못한 점이었는데요.
건설 분야 특화 데이터셋 부족으로 ‘말비계’ 등 용어를 엉뚱하게 직역했던 기존 번역앱들
크라우드웍스는 이를 해결하기 위한 사전 컨설팅을 통해 우선 ▲국토부 ▲안전보건공단 ▲S그룹 관계사 용어집 등에서 건설·조선 분야 전문용어 특화 데이터셋 구축했고요. 그 안에서 더 정확한 답을 끌어내기 위한 모델용 프롬프트 엔지니어링용 데이터를 선제적으로 구축했죠.
이어 요구사항 구현에 적합한 AI 모델에 대한 프롬프트 엔지니어링 작업을 추가로 진행해 15개국 언어로 번역 가능한 모델 구축에도 성공했습니다. 이후 실사용자가 정확하고 편리하게 사용 가능하도록 105만회 이상의 검증 절차도 진행했죠. 그 결과 앱은 현장에서 사용하는 용어를 오류 없이 번역했으며 현장 근로자 테스트에서도 정확도 및 만족도 90% 이상의 호응을 얻었다고 합니다.
‘건설·조선업 특화 AI 통역앱’ 결과물
특히 이런 결과는 초기 설계단계부터 건설·조선 현장이란 낯선 환경에 대해서도 가장 적합한 데이터를 효과적으로 확보 및 가공하는 과정의 노하우가 충분히 따랐기에 가능한 일로 평가됐는데요. 앞선 편에서 크라우드웍스의 또다른 성공사례로 언급된 ‘해상 자율주행 솔루션 개발을 위한 학습 데이터 가공기’와도 결이 비슷하다고 볼 수 있습니다. 결과적으로 수많은 데이터 가공 프로젝트를 통해 축적한 노하우가 복잡한 의뢰가 주어질 때일수록 더욱 빛을 발하는 결과로 이어지고 있는 셈이지요.
AI, 그 무한한 비즈니스 확장성
크라우드웍스는 최근 시장의 LLM 비즈니스 트렌드가 ‘맞춤형 LLM’로 향하고 있으며, 기업별 요구사항도 더욱더 다양해지고 있다고 말합니다. 아직 성숙한 수준은 아니라도 LLM에 대한 전반적인 이해와 도입 사례가 늘어나면서 더 많은 기업이 각자 필요에 특화된 LLM 도입 수요를 보이고 있다는 이야기죠. 또한 이 변화는 아직 초기단계이므로 앞으로의 비즈니스 확장성은 상당히 광범위한 것으로 평가됩니다.
크라우드웍스는 이런 분위기에서 좋은 결과를 내려면 민첩하고 유연한 대응 능력 또한 중요하다고 말합니다. 크라우드웍스 역시 상장사로서 점차 덩치를 키워 나가고 있지만 사업 측면에선 여전히 ‘스타트업’의 마인드로 기민한 대응 기조를 이어가겠단 포부죠.
현재 크라우드웍스가 주목하는 LLM 비즈니스 카테고리는 ▲LLM을 위한 데이터 구축 ▲LLM 도입을 위한 컨설팅 ▲챗봇 등 애플리케이션 개발 ▲모델 평가와 검증까지 다양한 서비스가 포함돼 있습니다.
또한 앞서 데이터 가공 및 구축 사업에서 축적한 노하우를 LLM 응용 비즈니스로도 빠르게 확장 중인 상황인데요. 궁극적으론 데이터와 LLM에 이르는 기초-응용단계 비즈니스 노하우를 더욱 축적하며 미래형 AI 비즈니스에도 대응할 수 있는 경험과 체급을 쌓아갈 것으로 기대됩니다.
사실 ‘모든 AI의 밑바탕은 데이터’란 명제를 다시 꺼내보더라도, LLM 이후 차세대 AI 기술 트렌드에서도 데이터와 LLM 가공 및 설계 역량은 계속된 경쟁력을 만드는 기초체력이 될 것으로 생각해볼 수 있습니다. 가깝게 최근 포착된 신규 사업 기회로는 ‘LLM 교육과정’을 꼽았습니다. 크라우드웍스는 2020년부터 이미 전문 데이터 작업자 육성을 위한 교육사업을 하나의 비즈니스 모델로 운영해왔는데요. 시대가 변화하고 LLM에 대한 이해와 활용 능력이 새로운 AI 전문인재들의 필수 역량으로 대두하자, 자연스레 LLM 교육 프로그램에 대한 수요가 생겨나고 있는 겁니다. 이 부분 역시 앞서 축적한 데이터 교육 사업의 노하우가 충분히 발휘될 수 있을 것으로 예상되는 영역입니다.
스케일AI 닮은꼴 아닌 ‘크라우드웍스’
지금까지 ‘데이터’와 ‘LLM’, 두 편에 걸쳐 크라우드웍스의 기술 경쟁력 및 변모된 사업 비전에 관한 이야기를 풀어봤습니다. 누군가는 이 회사가 여전히 1편에 언급된 ‘스케일AI’란 외국회사와 닮은꼴이라 생각할지 모르겠습니다. 하지만 속을 살펴볼수록, 그 내실은 크라우드웍스만의 독자적인 노선과 가치에 따른 정체성이 점점 더 확고해진 과정이었음을 알 수 있었는데요. 특히 외국산 AI, 응용 서비스들과 치열한 경쟁 중인 한국에서도 한국어 데이터 처리에 최적화된 국내 데이처 처리 전문 기업의 역할을 그간 크라우드웍스가 해낸 점, ‘데이터 빅테크’란 포부를 안고 본격적인 해외시장 공략을 준비 중인 점에서 이들 또한 타사의 그림자로 머물지 않겠단 의지가 잘 드러난 듯합니다.
특히 올해의 크라우드웍스는 김우승 대표의 신규 선임을 비롯해 1세대 데이터 전문 기업에서 ‘신뢰할 수 있는 AI 파트너 회사’로의 이미지 전환에 사활을 걸고 있는 상황입니다. 또한 이를 앞으로의 매출 구조 변화, 다양한 신규 프로젝트 사례 확보, 스케일AI에 뒤지지 않는 해외사업 경쟁력 증명을 통해 차근차근 이뤄낼 것으로 기대하고요. 무엇보다 글로벌 시장에 ‘크라우드웍스’란 브랜드를 확실히 각인함으로써 한국의 AI 기술 경쟁력도 널리 알리는 역할을 해내길 함께 기대해 봅니다.