실리콘 밸리의 ‘현타’
조짐이 시작된 것은 지난 2024년 크리스마스 다음 날이었습니다. 딥시크-V3 모델이 공개되면서 업계가 술렁이기 시작한 겁니다. 먼저 눈길을 끈 것은 성능입니다. 메타의 라마(Llama) 3.1, 오픈AI의 GPT-4o와 비슷하거나 오히려 더 나았습니다. 다음으로 입길에 오른 것은 가성비입니다. 딥시크-V3 모델의 개발 비용이 약 557만 달러라는 겁니다. 우리 돈으로 약 82억 원 정도이니 적지 않게 느껴지지만, 메타가 라마(Llama) 개발에 쏟아부은 돈은 지금까지 6억 4000만 달러 (약 8천 960억 원)에 달합니다. 메타가 쓴 돈의 1퍼센트로 비슷한 성능의 AI 모델 개발에 성공했다는 얘기죠.
업계의 술렁임이 채 잦아들기도 전, 딥시크는 쐐기를 박습니다. 지난 1월 20일, 딥시크-R1 모델을 내놓았죠. 이번에는 추론 모델입니다. AGI에 매우 가까워졌다고 평가받는 오픈AI의 o3 모델이 타겟이었습니다. 벤치마크 결과, 딥시크-R1 모델은 오픈AI의 o1, o3 모델과 유사한 성능을 보였습니다. R1의 개발 비용은 약 600만 달러입니다.
당장 실리콘 밸리는 ‘현타’를 호소하기 시작합니다. 한 메타 직원은 직장인 커뮤니티 ‘블라인드’에 글을 올려 회사 조직이 충격에 빠져있다고
밝히기도 했죠. 지금 메타의 개발자들은 딥시크의 모델을 해부하고 가능한 모든 것을 베껴내기 위해 전력을 다하고 있다고 전했습니다. 또, 조직의 리더들이 AI 개발에 쏟아부어 온 막대한 비용을 어떻게 정당화할 수 있을지 걱정하고 있다는 얘기도 덧붙였죠.
조직 내부에만 설명해서 될 일이 아닙니다. 메타는 물론이고 오픈AI, 앤트로픽 등의 프론티어 AI 기업들은 전 세계의 투자자들, 주주들에게 지금까지 ‘헛돈’을 써 온 것이 아니라고, 앞으로도 그 많은 돈이 정말 필요하다고 증명해야 합니다. 이미 시장은 의심하고 있습니다. 엔비디아의 시총 5890억 달러가 하루 새 증발했습니다. 역대 최고치입니다. 브로드컴, TSMC, 서버 업체 오라클 등도 충격을 피하지 못했습니다. 단, 이번 사건을 기술과 투자의 관점에서만 볼 수는 없습니다. 딥시크의 부상은 월스트리트나 실리콘밸리만의 걱정거리가 아닙니다. 진짜 긴장하고 있는 것은 워싱턴입니다.
미국의 착각
딥시크-R1은 미국의 몇 가지 믿음을 흔들어 놓았습니다. 그 첫 번째는 정치가 기술적 해자를 만들 수 있다는 믿음입니다. 2022년 8월 이후 미국 상무부는 첨단 AI 반도체의 대중국 수출을 금지했습니다. 중국 군대가 사용할 수 있다는 것이 이유였죠. 그래서 딥시크는 오픈AI나 메타 같은 실리콘밸리 회사들이 쓰는 H100 칩 대신, 일부러 성능을 낮춘 H800 칩을 사용해야 했습니다. 물론, 중국이 그동안 H100 칩을 불법적인 방법으로 확보했을 것이라는 주장도 있습니다. 그래도 딥시크가 컴퓨팅 성능 면에서 커다란 페널티를 안고 경쟁했다는 점에는 변함이 없죠.
바로 이 부분에서 생성형 AI가 돈으로 승부할 수 밖에 없는 판이라는 믿음도 깨집니다. R1은 추론 모델입니다. ‘강화 학습’ 방식으로 개발되었습니다. 비유하자면, 스스로 학습법입니다. 문제를 해결하면 높은 보상을, 해결하지 못하면 낮은 보상을 받게 됩니다. 딥시크가 내놓은
논문을 보면, 이러한 ‘자습’ 과정을 반복하다 보면 ‘깨달음의 순간(Aha Moment)’이 찾아온다고 합니다. 막대한 컴퓨팅 파워를 사용해 엄청난 양의 데이터를 학습시켜 개발해 온 지금까지의 방식과는 다릅니다. R1 모델은 생성형 AI가 돈의 문제가 아니라 과학의 문제라는 것을, 과학의 문제는 뛰어난 과학자가 풀 수 있다는 것을 증명했습니다.
마지막으로 미국이 AI 분야에서 초격차를 확보하고 있다는 믿음도 깨졌습니다. GAN, 트랜스포머, 스테이블 디퓨전 등 생성형 AI 기술의 역사는 미국을 중심으로 쌓여왔습니다. 유서 깊은 AI 연구 기관, 석학, 연구자들이 대부분 미국에 모여있다고 해도 과언이 아니죠. 국가를 막론하고 AI 분야에서는 미국 유학파가 다수를 차지하는 이유입니다. 그런데 딥시크는 180여 명의 구성원 대부분이
중국 국내파입니다. 주요 연구자들도 매우 젊습니다. 주축 멤버들 중에는 석사 학위도 채 마치지 않은 이들이 꽤 있을 정도니까요. 중국의 젊은 연구자들이 2023년에 설립한 스타트업이 미국의 AI 연구 역사를 단숨에 뛰어넘은 겁니다.
AI가 미국의 것이라는 착각이 깨지면서 미국 정부는 국가 안보에 걱정거리가 늘었습니다. 중국이 AI 분야에서 미국을 앞지른다면 세계 경제의 축이 중국으로 기울 가능성이 생깁니다. 국방력에서도 AI 기술은 이미 핵심 사안입니다. 세계 제일의 군사 대국 미국의 지위가 흔들릴 수도 있습니다. 그리고 무엇보다, 안티 차이나를 표방하며 관세 전쟁을 선언한 트럼프 대통령의 정치적 입지도 흔들립니다. 겉으로는 ‘잘된 일’이라며 딥시크의 성과에 태연한 척하고 있지만, 트럼프는 지금 마음이 급할 겁니다. 취임식 당일 함께 기자회견장에 섰던 오픈AI의 샘 올트먼 CEO가 급히 이런
코멘트를 남긴 것도 무관하지 않아 보이는 까닭입니다.
“딥시크의 R1은 가성비를 생각하면 인상적인 모델입니다. 우리(오픈AI)는 훨씬 더 나은 모델을 제공할 것이며 새로운 경쟁자가 있다는 것은 정말 고무적인 일입니다! 몇 가지 새로운 것을 선보이겠습니다.”
달라지는 것, 달라지지 않는 것
우리는 아직 인간의 지능을 뛰어넘는 인공지능에 도달하지 못했습니다. 인간을 노동으로부터 해방시키는 정도까지는 아니더라도, 우리 삶의 패러다임을 바꿀만한 정도의 AI 모델은 아직 등장하지 않았죠. 딥시크는 우리의 최종 목적지를 향하는 또 다른 길을 제시했을 뿐입니다. 좀 더 저렴하고 효율적인 길 말입니다. 게다가 그 길은 딥시크가 처음 제시한 것도 아닙니다. 오픈AI도
비슷한 방식으로 o1, o3 모델을 개발했으니까요.
따라서 달라지지 않는 것이 있습니다. 엔비디아를 비롯한 AI 인프라 업체들의 기세입니다. 단기적으로는 주가가 빠졌지만, 장기적으로는 오히려 호재일 수 있습니다. 스푸트니크 쇼크 당시의 미국을 생각해 보면 쉽게 알 수 있습니다. NASA를 만들고 엄청난 돈을 쏟아부었습니다. AI 붐은 더욱 뜨거워질 것입니다. 게다가 지금까지 알려진 것보다 작은 규모의 투자로도 프론티어 AI에 도달할 방법이 생겼으니 더 많은 업체가 제2의 딥시크를 꿈꾸며 뛰어들 가능성도 있습니다. AI 반도체는 물론 데이터 센터 등의 수요는 앞으로도 강력할 것입니다. 물론, 엔비디아 천하가 반드시 지속되리라는 보장은 없습니다. 중국은 AI 반도체 개발에도 박차를 가하고 있으니까요.
달라질 것도 있습니다. 오픈AI의 아성입니다. 오픈AI는 ‘클로즈드AI’라는, 그다지 유쾌하지 않은 별명을 갖고 있습니다. AI 모델 개발과 공급에 있어 폐쇄적인 구조를 고집해 오고 있기 때문입니다. 이제 연구자들은 오픈AI의 o1, o3 모델이 어떤 방식으로 개발되었고 작동하는지를 딥시크의 R1 논문을 통해 유추하고 있습니다. 딥시크가 오픈소스 형태로 모델을 공개했고, 논문을 통해 개발 과정을 상세히 밝혔기 때문입니다. 전 세계가 딥시크-R1 모델 마음껏 주무를 수 있게 되자 발전 속도도 상상을 초월하고 있습니다. 벌써부터 R1을 증류하여
소형화한 모델 등이 개발자 채널을 통해 공유되고 있습니다.
그들만의 리그가 된 줄 알았던 AI 씬에 드라마틱한 변화가 다시 시작되었습니다. 딥시크의 챗봇 앱은 오픈AI의 챗GPT를 제치고 애플 앱스토어 다운로드 수 1위를 기록했고, R1에 이어 이미지 생성 AI 모델 ‘야누스 프로(Janus-Pro)’까지
공개하며 멀티 모달까지 달성했습니다. 변화는 더 빠르고 다채로워질 것입니다. 그리고 미국은 중국산 AI의 발목을 잡기 위해 무엇이든, 정말 무엇이든 할 겁니다.