[궁금한.ai] AI로 영상 어디까지 만들 수 있을까? Luma AI 드림머신 사용기

여러분은 개인 시간에 어떤 콘텐츠를 가장 많이 소비하시나요?

저는 요즘 인스타그램 릴스와 유튜브 같은 영상 콘텐츠를 가장 많이 보는데요. 오늘은 콘텐츠 소비자가 아닌 창작자가 되어보려고 합니다!

이번 6월 미국 인공지능 스타트업 루마(Luma AI)에서 드림머신(Dream Machine)이라는 새로운 영상 생성 AI를 출시했는데요. 오픈 AI의 소라(Sora)와 비교할 정도로 높은 퀄리티를 가지고 있고, 누구나 쓸 수 있게 공개되어 있어 반응이 아주 뜨겁습니다. 

드림머신은 간단한 텍스트와 이미지를 입력하면 영상으로 만들어줄 뿐만 아니라, 영상 속 액션이나 표정도 생생하게 담아줍니다. 카메라 무빙처럼 움직이는 영상도 만들 수 있죠. 특히 물리 법칙을 반영해 사실적인 영상을 생성하는데요. 기존의 영상 생성 AI는 러닝머신에서 뒤로 달리고 있는 사람의 영상을 만들었다면, 루마 AI의 드림머신은 앞을 보고 달리는 사람의 영상을 만듭니다.

가입 후에 한 달은 무료로 사용할 수 있고, 하루 10개, 총 30개까지 무료로 비디오를 만들 수 있으니 사용해 보지 않을 이유가 없겠죠. 여러분도 한 번 사용해 보시면 어떨까요? 시간이 없으시다면, 제가 대신 재미있는 사용기를 들려드릴게요! (아, 제가 지금 원고를 작성하는 6월 21일에는 사용량이 많아 하루 5개까지 생성이 가능하다는 제한이 생겼는데요, 이 점도 참고해 주세요.)

사용하는 방법도 어렵지 않습니다. 검색 창에 원하는 시나리오를 입력하고, 이미지가 있다면 이미지를 첨부해 주세요. 2분 안에 5초 길이의 영상이 생성되는데, 영상을 한 번 만들어볼까요?

#1. 사진 속 물체를 인식해 영상 제작하기

어떤 영상을 만들어볼지 고민하는데 제 책상에 놓인 인형들이 가장 먼저 생각났어요. 모두가 퇴근하고 조용한 사무실에 인형들만 남는다면 무슨 이야기를 할까요? 아래와 같이 프롬프트를 입력하고, 제 책상 사진을 넣었는데요.

Q : 모두가 퇴근한 사무실에서 책상 위 인형들이 춤을 추는 영상을 만들어줘. 왼쪽부터 갈색 강아지, 노란색 하마, 흰색 토끼, 갈색 곰돌이야.
Please create a video of toys dancing on desks in an empty office after everyone has left. There’s a brown dog, a yellow hippo, a white rabbit, and a brown teddy bear.

리듬을 타는 토끼라니 너무 귀엽지 않나요? 4개의 인형을 모두 인식했는지는 모르겠지만, 토끼는 확실히 인식한 것 같군요.

#2. 사진 속 텍스트를 인식해 영상 제작하기

그러면 이번엔 사진 속 텍스트도 인식하는지 궁금해졌어요. 풍선(Balloon)이라는 글씨가 적힌 박스 사진을 첨부한 뒤 ‘박스를 언박싱해줘.’ 라고 한다면 과연 상자 속에 풍선이 들어있을까요?

Q : 언박싱 영상을 찍어줘. Please film an unboxing video.

오! 이번에는 박스를 언박싱하는 손이 화면에 등장하면서 영상이 시작되었어요. 상자가 열리는 방식은 조금 어색하지만 박스 위에 적힌 Balloon이라는 텍스트를 인식했는지, 상자 속에 다양한 색상의 풍선들이 보이는데요. 아직은 조금 불안정하지만 저는 2분 만에 이 정도 퀄리티라면 놀랍다고 생각했어요! 앞으로 더 자연스러워질 영상들이 기대됩니다.

#3. 사진 속 텍스트를 인식해 영상 제작하기(2) 한국어 

마지막으로는 한국어 텍스트를 인식해 컨퍼런스 홍보 영상을 제작해 보았어요. 한국어로 작성된 현수막 이미지를 입력하고 다음과 같이 요청했죠. 과연 루마 AI가 한국어도 잘할 수 있을까요?

Q : 우리 회사 컨퍼런스 일정인데, 홍보 영상을 만들어줘. LLM 서비스 신뢰성 검증, 기업 맞춤형 LLM 도입 전략을 비롯해 은행권에서 LLM을 개발한 사례를 발표할 거야.

Here’s our company’s conference schedule. Can you create a promotional video for it? We’ll present topics such as LLM service reliability validation, strategies for adopting customized LLMs for businesses, and case studies on LLM development in the banking sector.

앗, 이번에는 현수막 이미지가 잠깐 화면에 비친 후 갑자기 외국인들이 박수를 치는 장면으로 전환됐어요. 이 장면은 우리 회사의 컨퍼런스와는 거리가 먼 느낌인데요. 루마 AI가 한국어 텍스트를 잘 인식하지 못한 걸로 보여요. 아마 루마 AI가 학습한 데이터에 한국어 이미지와 한국어의 비중이 적기 때문이겠죠.

생성형 AI로 영상을 만들어보니..

Dream Machine 사용 후기를 요약하면 전반적으로 인터페이스가 쉽고 답변 속도가 빠르다는 점에 만족도가 높았는데요. 작년만 해도 이미지를 활용해 영상을 만든다고 하면 단순히 표정이 바뀌는 정도였는데, 이젠 구체적인 동작도 구현 가능해졌다는 점이 가장 놀라웠어요. 아직 불안정한 영상들도 종종 보이지만 프롬프트를 자세히 적어 보며 영상의 퀄리티가 높아지는 모습을 관찰하는 재미도 있었답니다. 내년에 나오는 Sora는 또 얼마나 새로운 모습들을 보여줄까요?

바야흐로 지금은 ‘콘텐츠의 시대’라고 하는데요. 의지만 있다면 콘텐츠를 만드는 일은 점점 쉬워지고 있어요. 오늘 만들어 본 영상들처럼 내 일상 속 이미지를 영상으로 제작하거나, 상상력을 발휘해 상황을 만들고, 원하는 내용을 홍보하는 일이 어려운 일이 아니게 된 거죠.

여러분들은 앞으로 어떠한 콘텐츠를 만들어보고 싶나요?

이달의 리뷰어

박경인 | 크라우드웍스 전략기획실 Manager
의무감보단 설렘으로 눈을 빛내며 일하기를 추구합니다.