데이터구축사례 보관

AI를 진짜 AI답게 만드는, 크라우드웍스 지능형 데이터 솔루션

AI를 도입했는데, 왜 기대만큼 성능이 안 나올까요? AI 모델의 성능은 빠르게 발전하고 있지만, 기업이 실제 업무에 AI를 도입했을 때 기대만큼 성과를 내지 못하는 경우가 많습니다. RAG로 내부 문서를 연결하더라도, AI가 이해할 수 있는 형태로 변환되지 않으면 정확한 답변을 기대하기 어렵습니다. 특히 표, 레이아웃, 텍스트 구조가 누락되거나 잘못 처리되면 AI는 문서의 맥락을 제대로 파악하지 못하고 부정확한 […]

[데이터바우처] K-콘텐츠 전문번역 솔루션 고도화를 위한 다국어 데이터셋 구축

AI 기반 전문 번역 서비스 기업, 시올은 고도화된 생성형 AI 번역 솔루션 ‘워드센스(WordSense)’를 운영하며, 웹소설·드라마 등 K-콘텐츠의 글로벌 확산을 지원하는 기업입니다. 단순한 AI 번역을 넘어, 현지 문화와 정서에 맞는 고품질 번역을 목표로 전문 번역가의 검수와 AI를 결합한 SaaS 기반 번역 품질 검증 플랫폼을 제공하고 있습니다. 프로젝트의 시작 시올은 AI 기반 전문 번역 서비스 워드센스를 통해 […]

[데이터바우처] ADHD 보조기기 개발을 위한 정밀 뇌파(EEG) 데이터 수집

ADHD 치료를 위한 헬스케어 스타트업, 피치라이프사이언스는 신체에 부담을 주지 않는 신경 자극 기술을 활용해 뇌 질환 치료와 인지 기능 개선을 돕는 전자약 전문 스타트업입니다. 성인 집중력 향상 기기 ‘피치업(Peach-Up)’과 소아 ADHD 치료용 의료기기 ‘피치피스(Peach Peace)’를 개발하고 있습니다. 프로젝트의 시작 피치라이프사이언스는 ADHD 선별 알고리즘의 정확도를 높이고 개인 맞춤형 케어 솔루션을 고도화하기 위해, 단순한 뇌파 데이터 수집을 […]

피지컬 AI 데이터의 새로운 표준

고품질 피지컬 AI 데이터를 확보하는 방법 로봇이 인간처럼 보고, 이해하고, 움직이는 피지컬 AI(Physical AI) 시대가 열리면서, 그 핵심 자원은 VLA 데이터(Visual–Language–Action) 로 자리 잡고 있습니다. 그러나 실제 데이터를 구축하는 과정에서는 행동 데이터의 부족, 표준화되지 않은 포맷과 구조, 체계적인 관리 시스템 부재 등 많은 어려움이 뒤따릅니다. 크라우드웍스는 이러한 문제를 해결하기 위해 VLA 모델의 수집・학습・검증・운영 전주기 데이터 […]

생성형 AI 탈옥 연구를 위한 독성 콘텐츠 평가 데이터셋 구축

고객사 한국전자통신연구원(ETRI)은 과학기술정보통신부 산하의 연구기관으로, 정보·통신·전자·방송 등 ICT 전 분야에서 산업 원천기술 개발과 성과 확산을 통해 국가 경제와 사회 발전에 기여하고 있습니다. 주요 연구 분야는 AI, 반도체, 네트워크, IoT, 빅데이터, 로봇, 보안, 무선통신 등이며, 최근에는 AI 반도체·엣지 컴퓨팅·생성형 AI·지능형 네트워크 등 첨단 AI 융합 기술 개발에 연구에 집중하고 있습니다. 프로젝트의 시작 ETRI는 LLM이 생성한 멀티모달(이미지+텍스트) […]

우리 회사 AI 경쟁력을 높이는 데이터 구축 가이드

산업 현장에 최적화된 AI 데이터를 구축하는 방법 AI 경쟁력을 높이는 데 가장 중요한 것은 바로 ‘데이터’입니다. 산업 현장에서 활용할 수 있는 효과적인 AI 데이터를 만들려면, 도메인 특화 데이터 구축 경험과 대규모 데이터를 처리·운영할 수 있는 역량이 필요하죠. 크라우드웍스는 표준화된 프로세스 및 상시 품질 관리 체계를 통해 고품질의 AI 데이터를 제공합니다. 63만 명 규모의 데이터 작업자 […]

크라우드웍스, 고난도 LLM 데이터 구축 사례 공개

– VLM과 자체 개발한 검수 툴로 데이터 품질 및 효율 동시 확보 – 전문 데이터가 AI의 핵심 자산… 산업별 AI 고도화 지원 박차 AI 기술 고도화에 따라 고품질 데이터 수요가 빠르게 늘어나는 가운데, AI 테크 기업 크라우드웍스가 최근 수행한 고난도 LLM 학습 데이터 구축 사례를 공식 기업 블로그를 통해 공개했다. 이번에 공개된 주요 사례는 ▲인포그래픽 […]

까다로운 전문 의료 AI 과제, 크라우드웍스는 어떻게 해결했나? NIA 의학지식 Q&A 데이터셋 구축

고객사 한국지능정보사회진흥원(NIA)은 과학기술정보통신부 산하의 공공기관으로, 다양한 국가 AI 데이터 사업을 기획하고 운영하며, 고품질의 AI 학습 데이터 생태계 조성에 선도적 역할을 하고 있습니다. 프로젝트의 시작 NIA는 AI 데이터 생태계 확산을 목표로 ‘초거대 AI 확산 생태계 조성 사업’을 추진했습니다. 이 사업은 여러 전문 기업과 기관이 컨소시엄을 이루어 함께 수행하는 대규모 국가 과제였으며, 그중 하나로 의학 지식에 대한 […]

‘마케터가 SQL을 쉽게 쓰도록 돕는 AI’를 위한 ‘Text to SQL’ 파인튜닝 데이터셋 구축

고객사 K는, 신용카드와 체크카드, 금융 서비스 등을 제공하는 국내 주요 카드사입니다. 다양한 제휴 혜택과 디지털 결제 플랫폼을 통해 고객의 일상에 맞춤형 금융 서비스를 제공합니다. 프로젝트의 시작 크라우드웍스에 프로젝트를 의뢰한 K사는 카드 사용률 증대 및 가맹점 캠페인 기획 등 다양한 마케팅 목적을 위해 내부 DB를 자주 활용합니다. 그러나 마케터가 직접 SQL 쿼리를 작성하기 어려워 데이터 접근의 […]

복잡한 인포그래픽과 텍스트를 매칭하는 AI 학습 데이터 구축

고객사 A는, 국내 대표 통신사로 AI, 빅데이터, 클라우드 등 ICT 융합 기술력 기반의 사업 혁신을 추진하고 있습니다. 최근 사내 업무 효율화를 위해 AI를 전사적으로 도입하여 활용하고 있어요. 프로젝트의 시작 A사는 업무 효율화를 위해 활용하는 AI가 내부 문서를 더 잘 이해하고 요약·분석할 수 있기를 원했습니다. 그 일환으로 대규모 AI 학습 데이터를 구축했는데요. 크라우드웍스를 통해 문서 내 […]

[태그:] 데이터구축사례