소라의 야망

bkjn review

창작의 캄브리아기가 아니라, 진실이 멸종되는 순간입니다.

소라의 야망

2025년 10월 27일

얼마 전 알고리즘에 ‘카톡 팝’이 등장했습니다. 카카오톡 개편 관련 뉴스를 찾아봤던 이력 때문이 아니었을까 싶었는데, 이게 꽤 인기를 끌었던 모양입니다. 구독자 50만 명 미만 크리에이터만을 대상으로 하는 인기 동영상 순위 ‘하이프(hype)’ 상위권에 아직도 카톡 팝이 보이는 걸 보면 말이죠. 적어도 ‘카카오는 이제 가난하다’라는 사실을 온 국민이 알게 되긴 한 것 같습니다.
이 영상은 오픈AI의 ‘소라 2(Sora 2)’로 제작되었습니다. / 출처: 이딴게
그런데 카카오는 사실 가난한 축에도 못 낍니다. 지금 진짜 돈이 급하게 필요한 회사가 있거든요. 바로 오픈AI입니다. 생성형 AI 시대의 주인공이지만, 돈은 못 법니다. 챗GPT의 주간 활성 사용자 숫자는 약 8억 명입니다. 페이스북과 맞먹는 수준이죠. 그러나 유료 사용자 비율은 약 0.25퍼센트에 불과합니다. 구독료를 받아 서비스 비용을 메꾸기 어렵습니다. 올해 오픈AI의 매출은 약 127억 달러 수준으로 예상됩니다. 페이스북의 모회사인 메타의 2024년 매출은 1640억 달러였습니다.

진짜 문제는 써야 할 돈이 너무 막대하다는 겁니다. 엔비디아와 마이크로소프트를 비롯한 수많은 투자자가 기대하고 있는 AGI(Artificial General Intelligence, 일반 인공지능)를 달성하기 위해서는 더 많은 컴퓨팅 성능이 필요합니다. 쉽게 말해 더 많은 GPU, 더 많은 데이터센터가 필요하죠. 여기에 2025년에만 160억 달러가 들 것으로 보입니다. 2030년까지는 총 1000억 달러의 추가 예산을 투입할 계획이고요. 오픈AI가 주도하고 있는 스타게이트 프로젝트는 무려 5000억 달러 규모입니다.

그래서 오픈AI도 카카오톡과 비슷한 선택을 했습니다. 카카오톡이 인스타그램과 같은 UX를 차용한 것처럼, 오픈AI도 메타의 길을 가기로 한 겁니다. 2025년 5월 오픈AI의 애플리케이션 부문 CEO로 영입된 피지 시모의 존재가 상징적입니다. 시모는 실리콘 밸리에서 기술 혁신이 아니라 ‘수익 창출’로 명성을 얻은 인물입니다. 2021년까지 10년간 메타에 재직했습니다. 친구의 친구를 연결하던 페이스북을 최고의 광고 플랫폼으로 만든 인물입니다. 시모는 오픈AI에서도 명성을 이어가려고 합니다. 그 첫 번째 시도가 바로 소라 2입니다.

오픈AI에 메타가 묻으면

카톡 팝의 뮤직비디오는 물론이고 꽤 많은 유튜브 플레이리스트의 영상들도 생성형 AI를 이용해 제작되었습니다. 그 중 소라 2를 사용한 것도 꽤 많고요. 사실, 쇼츠나 릴스, 틱톡 등 숏폼 플랫폼에서는 AI로 만든 ‘슬롭(slop)’ 동영상이 이미 꽤 많이 유통되고 있습니다. 의미도 맥락도 없는데 기괴하고 조금 웃기는 영상들입니다. 유명인의 데뷔 시절부터 최근 모습까지를 담은 영상이나 동물을 소재로 한 영상, 특정 성별이나 계층을 조롱하거나 희화화하는 영상 등 정형화된 패턴도 눈에 띄고요.

하지만 소라 2의 등장은 판을 완전히 바꿨습니다. 포토샵을 한 번도 사용해 본 적 없는 사람도 소라 2로 원하는 동영상을 정말 쉽게 만들 수 있습니다. 전작과는 비교가 되지 않죠. 더 빠르고 쉽습니다. 완성도도 있습니다. 마치 챗GPT처럼 프롬프트를 대충 입력해도 그럴싸한 영상이 생성됩니다. 다만, 소라 2가 정말 중요한 이유는 기술적 발전 때문이 아닙니다. 시모가 오픈AI에 도입한 페이스북의 영혼, ‘피드’가 핵심입니다.

오픈AI가 생성형 AI 시대의 주인공으로 자리 잡을 수 있었던 까닭은 그 어떤 경쟁자들보다 빠르게 AI 모델과 상호작용하는 방법을 제시했기 때문입니다. 전 인류가 챗봇을 통해 생성형 AI의 존재를 경험했습니다. 이성과는 별도로, 우리의 감성은 생성형 AI 모델을 일종의 인격체로 간주하고 있습니다. AI에 감정적으로 의지하는 사람들이 적지 않다는 사실은, 어찌 보면 당연한 결과입니다.

소라 2는 챗봇과는 완전히 다른 경험을 제공합니다. 단순히 영상을 생성하는 ‘기계’로만 작동하는 것이 아니라 틱톡이나 인스타그램과 같은 소셜 미디어 앱을 지향하죠. 앱의 디자인부터 동영상을 게시하고 공유하는 방법까지 너무나 익숙합니다. 앱을 열면 동영상 피드가 등장하고, 내가 프로필 페이지에 게시하는 모든 동영상은 다른 사람의 피드에도 표시됩니다.

비용 구조의 차이

생성형 AI로 우리는 글과 음악, 이미지와 동영상까지 모두 만들어낼 수 있습니다. 이렇게 무언가 만들어내는 도구로서 챗봇이란 형태는 꽤 유용합니다. 마치 아무것도 모르는 고객이 장인에게 물건을 주문하듯 대충 이야기해도 결과를 내놓는 방식 말입니다. 장인의 품삯도 저렴합니다. 한 달에 20달러 수준이니까요. 하지만 고객은 장인이 만든 물건을 다른 곳으로 가져가 전시합니다. 인스타그램이나 틱톡 같은 곳 말입니다.

메타 출신의 시모 CEO와 같은 사람들 눈에는 기회를 놓치고 있는 것처럼 보였을 수도 있겠습니다. 전시할 공간만 여기에 만들면, 틱톡이 가져가던 광고 수익을 오픈AI가 차지할 수 있겠다는 계산을 했을지도 모르죠. 그리고 만약 소라 2의 흥행이 쭉 이어져 실제 광고 수익 창출까지 달성한다면, 오픈AI는 아주 오랜만에 소셜 미디어 업계에 새로 등장한 유의미한 플랫폼의 주인이 됩니다.

다만, 이 시도가 과연 얼마나 돈이 될지는 미지수입니다. 메타가 엄청난 돈을 벌어들일 수 있는 까닭은 많이 벌기 때문이기도 하지만, 동시에 단위 비용이 매우 저렴한 까닭도 있거든요. 메타는 페이스북과 인스타그램, 스레드, 왓츠앱 등 수많은 플랫폼을 동시에 소유하고 있습니다. 운영 비용이든, 데이터센터 비용이든 규모의 경제가 실현됩니다.

오픈AI는 다릅니다. 소라 2는 아직 신생 플랫폼입니다. 단위 비용이 훨씬 많이 들 수밖에 없죠. 결정적으로, 인스타그램이나 틱톡의 경우 콘텐츠 제작 비용을 온전히 제작자가 부담하는 시스템입니다. 인스타그램에 릴스를 열심히 올린다고 메타가 그 비용을 부담하는 일은 없습니다. 크리에이터는 플랫폼이 선심 쓰듯 지급하는 광고 수익의 일부를 지급 받을 뿐이죠. 반면, 소라에서는 사용자들이 영상을 만들 때마다 그 추론 비용을 오픈AI가 감당합니다. 콘텐츠가 많아질수록 컴퓨팅 비용이 증가하는 구조입니다. 결국, 소라는 페이스북처럼 수익성 높은 광고판이 될 수 없습니다. 광고판 유지 비용이 너무 많이 듭니다. 그럼에도 소라는 오픈AI에 있어 일종의 실마리가 되었습니다.

학습 허가

소라와 비슷한 앱을 메타도 선보였습니다. ‘바이브스(vibes)’라는 이름으로 소라 2보다 조금 앞서 공개했죠. 하지만 아직까지는 별다른 반향을 일으키지 못했습니다. 적어도 소라 2보다는 말이죠. 바이브스에는 없고 소라 2에만 있는 것이 있거든요. 바로 ‘카메오’라는 기능입니다. 
바이브스는 틱톡이나 인스타그램의 릴스와 비슷한 동영상 공유 기능이지만, 모든 콘텐츠는 AI로 만들어집니다. / 출처: My Friends Call Me Pat
오픈AI를 가로막는 가장 큰 장애물은 아마도 ‘저작권’일 겁니다. 생성형 AI는 기본적으로 학습한 것을 조합하여 결과물을 만들어내는 기계입니다. 《뉴욕타임스》의 기사부터 레딧의 게시글까지, 지브리의 화풍부터 무명 일러스트레이터의 그림까지 예외는 없습니다. 챗GPT가 등장했던 시점부터 지금까지 저작권을 둘러싼 법정 다툼이 끊이지 않는 이유입니다. 그렇다면 초상권은 어떨까요? 저작권만큼 주목을 받은 것은 아니지만, 역시 법적으로 해결되지 않은 문제입니다. 배우 스칼렛 요한슨은 2023년 사진의 초상권을 침해한 AI 앱을 고소했던 적도 있습니다.

소라 2의 ‘카메오’ 기능은 이용자의 초상권을 오픈AI가 아무런 저항 없이 획득할 수 있는 기막힌 장치입니다. 사용자가 자신의 짧은 동영상을 앱에 업로드하면, 사용자 본인은 물론이고 친구들까지 그 모습을 활용해 AI 동영상을 제작할 수 있습니다. 언론인이 자신은 거짓말쟁이라고 고백하는 장면, 성직자가 우스꽝스러운 춤을 추는 장면을 얼마든지 만들어낼 수 있는 겁니다. 그 인물들을 팔로우하고 있다면 말입니다.

팔로우라는 장치도 일종의 관계입니다. 느슨하냐, 팽팽하냐의 문제일 뿐이죠. 나와 관계를 맺고 있는 사람들과 새로운 유희를 공유합니다. ‘우리’의 모습으로 익살스러운 장난이 계속되는 겁니다. 게다가 지금까지 해 본 적도 없는 방법입니다. 내 친구의 환영을 만들어내고, 그것을 공유하며 공감을 받는 겁니다. 카메오야말로 소라 2의 성공 요인입니다. 

멸종 위기의 진실

샘 올트먼은 소라를 소개하면서 ‘창작의 장벽을 부순 플랫폼’이라고 선언했습니다. 사람은 본질적으로 타인을 위해 무언가를 만들고 인정받기를 원하는 창작 욕구가 있는데, 소라가 그 욕구를 손쉽게 실현할 수 있도록 한다는 얘깁니다. 하지만 창작의 욕구와 관심을 향한 욕구는 다릅니다. 소라가 충족시키고 있는 것은 과연 어느 쪽일까요.

올트먼의 주장과 비슷한 이상향을 꿈꿨던 인물이 있습니다. 19세기 영국 미술 공예 운동을 이끌었던 윌리엄 모리스입니다. 급격한 산업화의 시대였습니다. 모리스는 급격한 산업화와 함께 대량생산 되어 쏟아지는 ‘추한’ 물건들에 문제 의식을 갖고 있었습니다. 아름다움이란 단순한 시각적 만족이 아니라 사회적 가치와 인간의 본성을 반영하기 때문입니다. 아름다움을 누릴 권리가 부자들에게만 있는 사회는 분명 불행할 것입니다.

그래서 모리스는 누구나 장벽 없이 예술 활동에 참여할 수 있으며, 그 결과 일상생활 속에서 예술이 꽃필 수 있는 세상을 주장했습니다. 엘리트 중심의 예술에서 공예 장인과 노동자가 창조적 활동을 통해 예술을 실천하는 시스템으로 옮겨갈 수 있다고 믿었습니다. 그리하여 노동자 계급도 예술적 창의력이 담긴 아름다운 의자를 가질 수 있는 시스템입니다.

소라가 시작한 새로운 세상이 그런 모습인지는 잘 모르겠습니다. 다만, 모리스가 이야기했던 예술과 소라를 이용한 영상 생성의 과정에는 차이가 있습니다. 모리스는 예술의 진정한 가치를 자유 의지로 즐겁게 작업하는 과정 그 자체에서 찾았습니다. 프롬프트를 입력해 환영을 만들어내는 과정도 고유의 아름다움을 내포하고 있다고 할 수 있을지는 의문입니다.

다만, 우리가 현실에 없는 현실을 만들어 공유하고 즐기는 행위에 적응하고 있다는 점만은 확실해 보입니다. 기술의 진보란 엄청납니다. 인류는 한 때 악마와 같은 초자연적 존재나 되어야 환영을 만들어낼 수 있다고 믿었습니다. 영화라는 기술이 처음 등장하고, 초점도 제대로 맞지 않는 흑백 영상에 사람들이 혼비백산하며 도망쳤던 때가 1895년입니다. 지금으로부터 겨우 130년 전이죠. 적어도 카메라는 현실을 담았습니다. 이제 누구든 손끝에서 존재한 적 없는 현실을 생생하게 창조해 낼 수 있습니다. 

인간은 본대로 믿도록 설계되었습니다. 사실이 아닌 것을 본 세월이 얼마 안 되기 때문입니다. 사진과 영상은 발명된 순간부터 조작의 의혹에서 벗어날 수 없었지만, 그것은 매체의 속성에 ‘사실’이라는 요소가 포함되어 있기 때문이었습니다. 그러나 이제 스마트폰을 꺼내 사진을 찍는 것보다 더 쉽게 AI 동영상을 생성할 수 있게 되었습니다. 실사의 비율은 급격히 줄어들 겁니다. 사람보다 기계가 더 빨리 만들어낼 테니까요. 이 새로운 시대에는 보는 것을 그대로 믿는 우리의 본능이 엄청난 약점이 될 수 있습니다. 범죄의 영역에서는 스캠 사기가, 정치의 영역에서는 가짜 뉴스가 이미 작동하고 있죠.
트럼프 대통령은 이런 AI 생성 영상을 자신의 소셜 미디어 계정을 통해 끊임없이 공유합니다. 이 영상이 가짜라는 것을 보는 사람이 알고 있다 하더라도 정치적 실익이 있다고 보는 겁니다. / 출처: Business Today
샘 올트먼은 소라의 등장으로 ‘창작의 캄브리아기’처럼 인류의 창의성이 폭발하는 계기가 될 것이라고 장담합니다. 하지만 소라는 생성형 AI 모델에 얼굴과 목소리를 공급하는 통로임과 동시에 진실의 정의를 지우는 플랫폼으로 기능하고 있습니다. 새로운 생명이 폭발적으로 탄생한 캄브리아기에 비유하기에는 뭔가 중요한 것이 멸종 위기에 처했습니다.
* bkjn review 시리즈는 월~목 오후 5시에 발행됩니다. 테크와 컬처, 국제 정치를 새로운 시각으로 이야기합니다.
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close