기계적 상상력에 관한 몇 가지 생각

bkjn review

인간의 법과 제도는 물론 사유까지 기계적 지능에 추월당했습니다.

기계적 상상력에 관한 몇 가지 생각

2025년 12월 16일

전 세계에서 AI 슬롭 동영상을 가장 많이 만들고, 시청하는 곳이 한국이라고 합니다. 생성형 AI를 이용해 양산형으로 만들어 낸, 의미도 맥락도 없는 동영상 말입니다. 한국이 1등을 했으니 국내 언론이 보도를 하긴 했는데, 내용을 살펴보면 약간 맥락이 다릅니다. 카프윙(kapwing)이라는 영상 편집 플랫폼에서 집계한 내용인데, 최근 인기가 상승한 채널의 순위를 매기는 ‘인기 급상승(trending)’ 차트에서 한국 기반 AI 슬롭 채널들의 비중이 높다는 겁니다. 그리고 그 채널들의 누적 조회수를 합산한 수치가 가장 많았다는 것이죠. 그러니까, 정확히는 한국 사람들이 AI 슬롭 동영상을 잘 만들고, 그 채널들이 최근 인기를 얻으면서 조회수도 많이 가져간다고 할 수 있겠습니다.

다만, 이 기사가 약간의 ‘과장’과 함께 작성된 배경은 짐작해 볼 수 있겠습니다. 독자층 중에 AI 슬롭 동영상을 보고 진짜인 줄 알았던 사람들이 꽤 있을 것이라고 전제하면, 눈길이 갈 법한 얘기입니다. ‘나만 속은 것이 아니다, 이렇게 많은 가짜 동영상이 있고 많이들 보고 있다’는 공감대가 생기니까요. 사실, 한동안 디지털 가짜 이미지를 구분하지 못하는 경우, 특히 고령층에 대한 우려가 있었던 것이 사실입니다. 그런데 상황이 좀 달라지고 있습니다. 가짜 이미지를 구별하는 능력은 이제 ‘리터러시’의 문제가 아닙니다. 기술은 인간의 생물학적 능력은 물론이고 사유까지 추월해 버렸습니다. 그리고 샘 올트먼은 그게 별달리 문제가 될 것이 없다고 주장합니다.
 
미국 코미디언 로니 챙은 밀레니얼 세대가 가짜 뉴스에 쉽게 속는다며, 젊은 세대는 그런 이미지를 자동으로 거를 수 있다고 이야기합니다. 언어가 좀 거칠긴 하지만, 몇 달 전까지만 해도 꽤 많은 사람들이 로니 챙과 비슷하게 생각했죠.
진짜의 새로운 범위

사진이 현실을 그대로 담는 매체였던 적은 없습니다. 사진이 스스로 현실이라고 주장하지도 않았죠. ‘예술’로 인정받아야 했기 때문입니다. 기술 발전으로 대중화가 시작되었던 19세기, 사진의 저작권을 두고도 법정 다툼이 적지 않았습니다. 렌즈의 방향을 정해 셔터를 누르면 그 순간이 기록됩니다. 이게 저작권을 인정할 만큼의 지적 생산물인지를 두고 논쟁이 있었던 겁니다.

그래서 사진을 찍는 사람들은 회화나 조각만큼이나 사진에도 사람의 재능이 필요하다고 주장했습니다. 구도 설정이나 빛의 조절, 인물 연출 등을 통해 완전한 이미지를 추구하는 일은 아무나 할 수 있는 것이 아니라는 겁니다. 사진가에 따라 같은 장면도 다른 사진으로 표현되고요.

사실입니다. 흔히, ‘사진을 잘 찍는다’라고 표현하는데, 사진을 찍는 행위에 잘하고 못하고가 있다는 얘깁니다. 찍는 사람의 역량이 결과물에 영향을 미친다는 의미가 되겠죠. 디지털 이미지가 보편적인 포맷으로 자리 잡으면서, 후보정 기술도 그 역량의 일부가 되었고요.

그런데 스마트폰이 등장하면서 이 역량이 대폭 기계로 흡수되었습니다. 작은 렌즈로 더 선명하고 아름다운 이미지를 얻기 위해서입니다. 빛이 이미지 센서에 도달한 후 최종 이미지 파일로 출력되기까지 수많은 연산 처리가 일어납니다. 대비와 선명도를 조절합니다. 얼굴은 밝히고 주변의 초점은 흐릿하게 처리합니다. 이런 작업 모두 현실을 최적화된 버전으로 기록하는 과정입니다.

샘 올트먼은 이런 과정이 일종의 ‘조작’이라고 이야기합니다. “오늘날에는 아이폰으로 찍은 사진조차도 약간은 진짜가 아니”라는 겁니다. 이 정도 수준의 조작은 진짜 현실로 받아들여지고 있다고 주장하죠. 즉, 무엇을 ‘진짜’라고 인정할 것인지에 관한 사회적 합의는 고정된 불변의 개념이 아니라 시대적 맥락에 따라 계속 변한다는 것이 올트먼의 생각입니다. 따라서 생성형 AI로 제작된 콘텐츠가 보편화할수록, ‘진짜’의 기준점이 움직여 그 허용 범위가 자연스럽게 넓어질 것으로 예측합니다.

올트먼이 이야기하는 ‘진짜’에 포섭될 수 있는 이미지는 어떤 것이 있을까요? 예를 들면 다음과 같은 이미지는 어떤가요?
나노 바나나 프로가 대단한 이유

이 이미지는 ‘나노 바나나 프로’로 생성한 것입니다. 구글이 일반 사용자를 위해 공개한 최신 이미지 생성 모델입니다. 부산에서 오사카로 가는 여객선 갑판의 모습이 담긴 사진을 생성해 달라고 했습니다. 대단한 프롬프트 기술 같은 건 없었습니다. 그런데 꽤나 그럴듯합니다. 테크 전문 매체 〈더버지〉는 나노 바나나 프로가 생성한 이미지들이 스마트폰 카메라로 촬영한 사진의 특징을 고스란히 갖고 있기 때문이라고 분석합니다.

스마트폰은 일반적인 디지털카메라에 비해 렌즈와 이미지 센서가 작습니다. 그래서 올트먼이 이야기했던 것 같은 ‘조작’을 거칩니다. 사진의 품질이 좋아 보이도록 보정하는 겁니다. 그 결과 밝고 균일한 노출, 넓은 피사계 심도, 약간의 노이즈로 인해 거칠고 바삭한 느낌 등의 특징을 보입니다. 그리고 이러한 특징들은 지금까지 ‘진짜 사진’이라는 신호로 작동했고요. 그런데 요즘 나노 바나나 프로가 생성하는 사진들이 딱 이렇습니다.

뿐만 아닙니다. 구글은 이번 모델에 구글 검색 엔진을 연결하여 실시간으로 정보를 가져오는 기능을 추가했다고 밝혔습니다. 그 결과 사용자가 구체적으로 지시하지 않아도 맥락에 맞는 디테일을 자율적으로 추가할 수 있는 것으로 보입니다. 예를 들면 요즘 날씨에 맞는 사람들의 옷차림이나 갑판 너머로 보이는 풍경, 조금씩 녹슨 기물들 같은 것 말입니다.

이제 AI가 만든 이미지를 명확하게 구분할 수 있었던 몇 가지 특징들은 완전히 사라졌습니다. 여섯 개의 손가락이나 일그러진 문자 같은 것 말입니다. 대신 이미지가 진짜라고 인식하게 만드는 신호는 정교하게 추가되었습니다. 이 정도면 로니 챙도 속아 넘어갈 겁니다. 올트먼에게 이런 이미지들은 ‘진짜’에 포섭될 수 있는 범주에 속할지도 모르겠습니다. 하지만, 저에게는 보이는 대로 믿어서는 안 되는 시대가 왔다는 신호로 읽힙니다.

진짜를 진짜가 증명했다는 증명

다시 사진의 정체성으로 돌아가 보죠. 사진은 현실이 아니지만, 현실의 기록이라는 속성을 분명 갖고 있습니다. 사진의 시작점이 피사체가 내뿜는 한순간의 빛이기 때문입니다. 그 빛이 필름이나 이미지 센서에 닿는 순간이 사진이 찍히는 순간입니다. 아무리 왜곡되고 보정되었다 하더라도, 그것은 사진이 찍힌 이후의 처리 과정입니다. 그래서 인간은 사진의 객관성을 때로는 지나치게 신뢰하는 경향이 있습니다. 예를 들어, 사진은 여러 상황에서 ‘증거’로 사용되죠. 개인 간의 다툼은 물론, 법정에서도 효력을 갖습니다.

반면, 생성형 AI는 저장되어 있던 데이터로부터 이미지를 만들어 냅니다. 기록이 아니라, 지식을 기반으로 한 창작입니다. 사진보다는 회화에 가깝습니다. 그러니 올트먼의 주장에 저는 동의할 수 없습니다. 사실에 어느 정도의 ‘처리’를 용인할 것인가의 논의와 창작물까지 사실로 보자는 논의는 전혀 다릅니다. 인간은 시각을 통해 사진과 회화, 즉 사실과 창작을 구분하는 능력을 지녔습니다. 문제는 기술의 급격한 발전으로 인해 그 능력을 잃어버렸다는 겁니다. 이제 인간은 사실의 기록과 기계의 창작을 구분할 수 없습니다.

다만, 이 현상이 사실과 거짓 사이의 경계를 흐려 전 세계를 디스토피아적인 미래로 몰고 갈 것이라고 단정 지을 수는 없습니다. 인류는 어떻게든 기록과 창작을 구분하는 법을 다시 배우게 될 겁니다. 눈이 더 좋아질 리는 없습니다. 생물의 진화는 그렇게 빠르게 일어나지 않으니까요. 하지만 뭔가 다른 방법을 배울 겁니다. 여섯 개의 손가락을 찾아낸 것처럼 말이죠. 그런 방법조차 없다면 만들 겁니다. 아니, 실은 이미 만들었습니다. C2PA(Content Credentials) 표준이라는 것입니다.

어도비와 오픈AI, 마이크로소프트 등 업계의 주요 기업부터 소니나 라이카와 같은 카메라 제조 업체, 《뉴욕타임스》와 같은 언론사 등이 참여하고 있습니다. 보이지 않는 디지털 서명을 암호화하여 이미지에 삽입하는 방식입니다. 카메라로 사진을 찍으면 자동으로 서명이 생성되어 콘텐츠에 포함됩니다. 이걸 해독하면, 현실 세계를 촬영한 이미지인지 쉽게 구분할 수 있습니다.

다만, 이 방법을 본격적으로 적용하기까지는 시간이 좀 걸릴 것으로 보입니다. 예를 들어 페이스북이나 인스타그램과 같은 소셜 미디어 플랫폼에서는 C2PA 마커를 확인해 AI 이미지 여부를 가리는 데에 참고합니다. 하지만, 이 정보를 일반 사용자들에게 공개하지는 않습니다. 대신 명백한 ‘AI 제작’ 콘텐츠에 라벨을 다는 방식을 선택했습니다.

현명한 선택입니다. 아직 대다수의 사용자는 사진처럼 보이는 이미지를 적극적으로 의심하는 단계에 진입하지 않았습니다. 언젠가는 그런 날이 오겠지만, 초기엔 꽤나 피곤한 일이 될 겁니다. 사용자를 붙잡아 둬야 돈을 버는 소셜 미디어가 사진이 진짜인지를 이야기하기 시작한다면, 매출에 도움이 되지는 않을 겁니다. 언론사도 마찬가지입니다. 지면이든 온라인이든 거짓이 실릴 리가 없어야 하는 공간입니다. 그런데 갑자기 ‘진짜’라는 딱지가 등장하게 되면 오히려 신뢰도 하락을 부추길 수 있습니다.

하지만 우리는 C2PA와 비슷한 시스템에 이미 익숙합니다. X.com이나 인스타그램 등에서 발견하게 되는 ‘파란 딱지’ 말입니다. 이 계정이 진짜라는 플랫폼의 보증이죠. 이미지도 비슷한 시스템을 도입하게 될 가능성이 있습니다. 가짜를 진짜로 속이는 일이 자꾸만 발생하고, 결과적으로 피해가 이어진다면 우리는 보증해 줄 시스템을 찾게 될 겁니다. 그리고 익숙해지겠죠.

유튜브 키즈 채널에서 쉽게 돈 버는 방법

기계가 만들어 낸 이미지가 사실과 거짓의 경계를 허무는 데 그친다면 해결할 방법이 있습니다. 그런데 AI 슬롭 중에는 현실과는 동떨어진 현란한 이미지를 앞세운 것들도 꽤 많습니다. 대개 10초 내외의 짧은 길이로, 전후 맥락 없이 도파민만 자극하곤 합니다. 이런 이미지가 너무 쉽게 생성되어 넘쳐나는 현상을 두고도 우려가 나옵니다.
각종 플랫폼에 이런 콘텐츠가 너무 많습니다. / 출처: 유튜브
환상적인 이미지는 인간을 매혹하곤 합니다. 프랑스의 시인이자 비평가였던 앙드레 브르통은 우리가 현실이라고 믿는 것이 객관적인 실재가 아니라 학습된 이성과 사회적 관습을 통해 구성된 것에 불과하다고 주장했습니다. 그리고 1920년대 전후로 큰 반향을 일으켰던 ‘초현실주의’ 물결을 선언했고, 찬양했죠. 1차 대전이라는 거대한 폭력을 겪은 이후, 인간의 이성을 중심으로 한 세계관을 의심하던 시기였습니다. 오히려 이성 너머에 존재하는 인간의 원초적 감각, 상상력, 꿈의 세계가 부조리한 현실을 넘어설 수 있는 급진적 가능성을 내포한다는 것이 브르통의 생각이었습니다.
초현실주의의 대표작으로 꼽히는 살바도르 달리의 〈기억의 지속〉 (1931). / 출처: 뉴욕 현대미술관
초현실주의의 중요한 요소 중 하나가 바로 어린 시절의 감각입니다. 아이들에게는 현실과 환상의 경계가 불분명하죠. 아직 이성과 관습에 의해 의식이 완전히 통제되지 않았기 때문입니다. 더 자유로운 상상을 할 수 있습니다. 꿈을 꾸고, 상상 속의 친구를 만들어 내고, 본 적 없는 풍경을 그립니다. 이러한 상상력을 꺼내어 가치를 인정할 때 현실 바깥의 가능성으로 나아갈 수 있습니다. 그 해방에의 욕망이 바로 초현실주의입니다.

반면 AI 슬롭은 환상을 강력한 시각 자극을 통한 클릭과 체류를 위한 장식으로 사용합니다. 관심 경제 시스템 속에서 이런 AI 슬롭들은 돈이 됩니다. 우리가 몇십 분동안 유리 사과를 자르는 쇼츠를 끝없이 스크롤하는 동안 채널 운영자들에게 수익이 분배되는 구조입니다. 그런데 이런 동영상에 더욱 쉽게 매료되는 시청자층이 있습니다. 바로 어린이입니다.

최근 유튜브 키즈 채널에 생성형 AI를 사용해 찍어낸 영상이 자주 등장하고 있습니다. 그 방법을 공유하는 영상이 인기를 끌고, 유료로 판매되기도 합니다. 챗GPT를 이용해 ‘랄랄라’, ‘짝짝’, ‘나나나’와 같이 무의미한 단어가 섞인 동요 가사를 작성하도록 합니다. 이 가사를 이용해 ‘수노’와 같은 생성형 AI 작곡 플랫폼에서 동요를 만들고, 동영상 생성 AI를 이용해 아이들이 좋아할 만한 화려한 영상을 만듭니다. 이렇게 만든 콘텐츠는 3세 이하 아이들을 매혹하고, 채널 운영자에게 하루 몇백 달러 수준의 안정적인 수익을 가져다준다는 겁니다.

이런 채널들은 끝없이 생겨나고 있습니다. 누구나 만들 수 있으니, 누가 만들었는지 궁금해 하는 사람도 없습니다. 클릭으로 돈을 버는 사람은 있는데, 문제가 생기면 책임질 사람을 찾기는 어렵다는 얘깁니다. 전문가들은 아이들의 뇌가 형성되기 시작하는 시기에 AI가 만들어 낸 허황된 정보들이 주입된다면, 세상을 이해하는 방식에 부정적인 영향을 미칠 것이라 우려합니다. 초현실주의가 갈망했던 어린 시절의 감각이 AI 슬롭에 의해 봉인될 수도 있겠습니다.

창백한 푸른 점

샘 올트먼은 대표적인 기술 낙관론자입니다. 초지능을 달성하고 생산성 폭발에 이르게 되면, 인류는 그에 따른 기본 소득으로 생활하며 보다 창의적인 일에 몰두하는 미래를 살게 될 것이라고 이야기합니다. 하지만 이미지 생성에 있어 생산성이 폭발한 지금, 우리는 환영과 사실을 구분하지 못하는 생물학적 한계 때문에 추가적인 비용을 지불하고 있습니다. 도구를 손에 쥔다고 모두가 유토피아로 나아갈 수 있는 것은 아닙니다.

인간의 상상력은 인간을 구원하곤 했습니다. 새로운 기술을 만들고, 인권의 범위를 넓히고, 인간의 오만을 의심했습니다. 생성형 AI라는 도구를 이용해 인간의 상상력은 더 넓게 열릴 수도 있을 겁니다. 다만, 지금은 그 도구에 인간이 휘둘리는 꼴입니다. 기계적 상상력을 상품으로 포장해 무작정 팔아치우고 있습니다. 인간의 생물학적 능력이 기계적 발전에 추월당한 것만이 문제가 아닙니다. 인간의 법과 제도는 물론 사유까지 기계적 지능에 추월당했습니다.
이 사진을 보면서 여러분은 무엇을 보시나요. 국경이 보이지 않는 지구, 생명을 품은 곳과 그 바깥의 대비, 인간과 지구라는 존재가 얼마나 작은지에 관한 감각 같은 것을 느끼셨을지도 모르겠습니다. 우리가 2025년 12월에 서 있기 때문입니다. 기후 변화와 생태 위기가 현실이 된 시점입니다. 이 사진은 우리가 얼마나 취약한 공동체인지를 깨닫게 하죠.

하지만 이 사진이 처음 공개되었던 당시에는 상황이 달랐습니다. 이 사진은 1968년 아폴로 8호가 인류 최초로 달을 유인 궤도 비행하던 중 달 표면 너머로 지구가 떠오르는 장면을 촬영한 것입니다. NASA가 이 사진을 언론에 공개한 뒤, 전 세계 신문과 방송이 이 장면을 현대 과학 기술 발전의 상징으로 보도했습니다. 인류가 달까지 갔다는 가장 명징한 증거로서 말이죠. 1960년대의 인류는 이 사진에서 혁신과 낙관적인 미래를 봤습니다. 결국, 우리는 우리가 보고 싶은 것을 봅니다. 그걸 기계적으로 구현한 결과가 알고리즘이겠죠. AI 슬롭이 넘쳐나는 시대 또한 그 결과일 겁니다.
* bkjn review 시리즈는 월~목 오후 5시에 발행됩니다. 테크와 컬처, 국제 정치를 새로운 시각으로 이야기합니다.
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close