AI 시대의 포획자는 누구인가

2024년 5월 17일, explained

오픈AI와 구글이 또 한 발짝 내디뎠다.

런던의 한 시각 장애인이 GPT-4o를 이용해 풍경의 묘사를 듣고 있다. 사진 : OpenAI
NOW THIS

인류가 신인류를 만들고 있다. 현지 시각 지난 13일과 14일, 오픈AI와 구글이 각각 내놓은 신규 AI 모델 이야기다. 오픈AI는 GPT-4o라는 이름의 신규 모델을 선보였다. 빠르고 저렴하며, 똑똑하다. 무엇보다 나와 같은 풍경을 실시간으로 보고, 듣고, 대화할 수 있는 AI다. 구글은 기존에 선보였던 ‘제미나이’를 모든 곳에 이식하겠다는 계획을 발표했다. 검색은 물론 스마트폰의 애플리케이션에도 제미나이가 적용된다. 내 모바일 활동 전반을 AI 비서가 관리해 준다는 얘기다.

WHY NOW

아이폰이 카메라, MP3 재생기, 노트, 휴대전화 등을 삼켰던 것처럼, 각각의 AI 모델도 점점 많은 것을 삼킬 수 있는 존재로 진화하고 있다. 그리고 그 진화의 방향은 인간이다. 인간보다 더 인간적인 AI는 우리의 일, 오락, 그리고 관계를 바꿔놓을 것이다. 그리고, 포식자가 될 것이다.

OMNI

선수를 친 것은 오픈AI였다. 지금까지 몇 차례 그랬던 것처럼, 구글의 가장 큰 행사, 연례 개발자 회의(구글 I/O)를 하루 앞둔 시점을 골라 온라인 라이브 행사를 가졌다. 오픈AI가 내놓은 것은 영화 〈그녀(Her)〉가 보여줬던 미래였다. 영화가 그린 2025년, 주인공은 인공지능 ‘사만다’에게 카메라와 마이크가 달린 디바이스를 통해 세상을 보여주고, 공감하고, 소통하며, 관계를 맺는다. ‘옴니(omni·라틴어로 모든, 전체의 의미)’라는 꼬리표를 단 GPT-4o 또한 마찬가지다. 스마트폰에 장착된 카메라와 마이크를 통해 외부 세계를 실시간으로 인식하고 명령을 수행한다. 오픈AI는 영화 속 상상의 세계를 1년 앞당겼다.

AI가 향하는 방향

튜링 테스트는 기계(컴퓨터)가 인간과 구별되지 않는 대화를 할 수 있는지를 평가하는 테스트다. 인공지능을 시작한 인물, 앨런 튜링이 고안한 것으로 이 테스트를 통과하면 그 기계는 최소한의 지능을 가진 것으로 간주하게 된다. 생성형 AI의 급격한 발전이 시작되면서, 학계에서는 튜링 테스트의 통과 여부를 중요시하지 않게 되었다. 하지만 AI의 방향은 여전히 인간을 향하고 있다. 지능이 무엇인지, 인간이 무엇인지에 관한 논의는 일단 미뤄둔 채 인간의 작업을 최대한 모방할 수 있는 방향이다.

또 하나의 지성

GPT-4o를 소개하는 몇 가지 동영상에서 가장 인상적이었던 장면은 시각 장애인이 택시를 타는 과정이다. GPT-4o는 사람처럼 보고, 듣고, 말한다. 응답 속도 또한 평균 320ms(밀리초·1,000분의1000분의 1초)로 단축했다. 인간의 속도를 따라잡았다. 맥락과 명령에 따라 감정을 표현한다. 샘 올트먼 CEO는 GPT-4o 모델을 두고 “컴퓨터와 대화하는 것이 자연스럽게 느껴진다”고 평가했다. 의미심장한 이야기다. 이제 인류는 몸이 없는 또 하나의 지성을 ‘소유’할 수 있게 됐다.

궁극의 검색

하루 늦게 진행된 구글의 행사에서는 오픈AI와는 다른 방식의 멀티모달을 선보였다. ‘궁극의 검색’이다. 행사장에 등장한 로즈 야오 구글 부사장이 고장 난 턴테이블을 내놓았다. 이걸 도대체 어떻게 고쳐야 할지 모르겠다며 스마트폰을 든다. ‘동영상 검색’ 기능을 통해 턴테이블이 작동하지 않는 이유를 물었더니 턴테이블의 제조사, 모델명 등을 인식해 고장 점검 매뉴얼이 출력되었다.

어떻게 말해도 찰떡같이

구글이 발표한 것은 인간 같은 AI가 아니라 인간 같은 ‘검색’이다. 그 궁극의 검색을 위해 AI 모델 제미나이를 사용한다. 구글은 전 세계 검색시장의 90퍼센트를 독점하고 있다. 그런 구글의 권력은 사용자가 입력한 검색 키워드에 어떤 결과물을 어떻게 보여줄 것인지에서 나온다. 그래서 구글이 보여주는 세계는 존재하고, 보여주지 않는 세계는 존재하지 않는 기현상이 발생하기도 한다. 이제 구글의 검색은 한 발 더 앞으로 나아간다. 대충 말해도, 대충 보여 줘도 어떤 정보가 필요한지 인식하여 답변한다. 심지어 검색 결과를 AI가 미리 검토해서 정리 및 요약해서 보여준다. 흔들리고 있는 검색의 제왕 자리를 지켜 내야만 하는 구글의 절치부심이다.

AI의 몸

이러한 궁극의 검색이 더욱 철저하게 일상에 스며드는 방법이 바로 AI 비서다. 행사 말미에 구글이 공개한 2분여의 동영상이 그 데모 영상이라고 할 수 있다. 구글의 런던 오피스에서 한 직원이 사무실 이곳저곳을 비추며 제미나이 AI와 대화를 주고받는 모습이다. 누가 봐도 오픈AI의 발표를 의식한 것이었다. 하지만 내용을 뜯어보면 조금 다른 부분이 눈에 띈다. 예를 들면 직원이 “혹시 내 안경 못 봤어?”라고 물어보면 조금 전 인식했던 내용을 ‘기억’해 알려주는 식이다. 스마트 글라스를 착용하자 매끄럽게 디바이스 변경이 이루어지며 대화가 이어진다. 실제 사용할 수 있으며 유용한 AI 에이전트, 게다가 디바이스라는 ‘몸’을 가진 존재의 등장을 예고하는 장면이었다. 인간처럼 보고, 듣고, 배우는 AI 비서, ‘프로젝트 아스트라’다.

인프라 포획

오픈AI와 구글, 두 기업 모두 기술은 준비되었다. 앞으로도 빠르게 발전할 것이다. 이들이 노리는 것은 ‘인프라 포획자’의 자리다. 인프라 포획(infrastructure capture)은 정부나 공공기관이 도로나 댐, 발전소 등 공공 인프라를 건설할 때 특정 이익 집단이 영향을 미치는 경우를 뜻한다. 우리 공장에 유리하게 도로를 건설하도록 로비하는 식이다. 21세기의 인프라 포획은 디지털 플랫폼과 같은 새로운 형태의 인프라가 특정 기업이나 소수의 경제 주체에 의해 지배되고 통제되는 형상이다. 모바일 시대의 인프라 포획자는 구글과 애플이다. AI 시대의 인프라 포획자는 아직 판가름 나지 않았다.

IT MATTERS

오픈AI와 구글뿐만 아니라 메타의 라마(LLAMA), 앤트로픽의 클로드(Claude) 등 플레이어는 많다. 아직 시장을 지배하는 AI 모델은 결정되지 않았다. 포획자가 되기 위해 오픈AI가 내놓은 전략은 무료 공개다. 처리할 수 있는 데이터의 양에 제한을 두긴 하지만, GPT-4o는 무료로 사용할 수 있다. 현재 AI 서비스를 유료로 사용하는 사용자는 충분치 않다. 정보통신정책연구원(KISDI)이 최근 발간한 보고서에 따르면 지난해 12월 기준 최근 3개월 동안 우리나라에서 생성형 AI 서비스를 사용해 본 사람은 약 40퍼센트였지만, 유료 서비스 사용 경험이 있는 사람은 이 중 3분의 1뿐이었다. 무궁무진한 시장이 아직 잠들어 있는 것이다. 무료로 공개된, 사람 같은 GPT-4o는 이 시장을 노린다.

구글은 스마트폰 시장에서의 경험을 살려 접근한다. 디바이스와 함께 가겠다는 전략이다. 온디바이스 경량화 AI 모델인 ‘제미나이 나노’를 통해 스마트폰 시장과 스마트 글라스를 포함한 AI 디바이스 시장까지 선점하고자 한다. LG는 제미나이를 탑재한 서비스 로봇 ‘클로이’를 다음 달 공개할 예정이다. 삼성도 내년 초 출시될 갤럭시 S25 시리즈에 제미나이 나노 모델을 탑재하기 위해 협의 중이다. OS 시장은 장악했으되 디바이스를 함께 가진 애플의 독주는 막지 못했던 과오를 반복하지 않기 위해 발 빠르게 움직이고 있다. 사용자가 어떤 디바이스를 구입하든, 구글의 AI 모델이 탑재되어 있다면 포획자의 위치를 점할 수 있다. 문제는 검색 시장, 메신저 시장 등에서 일종의 ‘자치 공화국’을 유지했던 한국의 미래다. 스마트폰 다음 시대, 즉 AI 디바이스 시대에도 한국은 이 자치권을 유지할 수 있을까. 혁신이 숨 가쁘게 이어진다. 그러나 그 혁신은 오직 영어로만 쓰이고 있다.
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close