언더스코어 강태영 대표 - 데이터로 언론을 읽다

데이터로 언론을 읽다

언더스코어 강태영 대표 
 

네이버의 감정 표현 버튼 정책 변경으로 유저들의 행동은 어떻게 바뀌었을까? 정말 퀴어 퍼레이드는 사람들의 ‘백래시’를 유도할까? 논문을 쓰는 고등학생들은 누구이고, 어떤 논문을 쓸까? 지금의 온라인은 무수한 정보와 커뮤니케이션에 잠겨있다. 정보의 소용돌이는 언뜻 무작위적으로 보이지만, 언더스코어는 그 소용돌이의 흐름과 모습을 포착한다. 그 포착의 도구는 다름 아닌 데이터다. 지금 필요한 질문을 콘텐츠로 풀어내는 언더스코어 강태영 대표에게 왜 데이터와 언론인지 물었다.


언더스코어는 데이터 기반으로 콘텐츠를 생산한다. 왜 데이터인가?

학부 2학년까지만 해도 정치철학 대학원을 꿈꿀 정도로 문과형 인간이었다. 그런데 공부를 해보니 사회 현상을 정확히 이해하기 위해 폭 넓은 데이터를 다룰 필요성을 느꼈다. 당시에는 일베 현상이 뜨거운 감자였고, 온라인의 무수한 데이터 역시 무시할 수 없었다. 과연 내가 온라인의 정치 현상을 이야기한다면서 온라인 데이터 수집도, 텍스트 분석도 하지 못한다면 스스로를 사회과학 연구자라고 할 수 있을까? 사실 데이터 활용은 예외적인 게 아니라 당연한 거다. 원래도 사회과학은 데이터를 활용하는 학문이었다. 자살 연구와 아노미 이론으로 유명한 사회학자 뒤르켐도 많은 데이터를 구하고 분석해 연구했다.

데이터를 활용하는 것이 학계에서는 새로운 일이 아니라는 말로 들린다.

언더스코어의 작업은 기본적으로 사회과학계의 데이터 분석을 언론과 미디어에 가져오는 작업이다. 학계에서는 고전적인 통계학과 딥러닝 등을 이미 10년 가까이 써왔다. 그러나 언론은 아니었다. 그렇다보니 데이터적인 접근이 언론 입장에서는 새로워 보일 수 있을 것 같다.

학계에서 쓰이던 데이터 분석 방법을 언론으로 끌고 와야겠다고 생각했던 계기가 있나.

언론은 대부분 정성적으로 이야기를 푼다. 혐오 발언을 예로 들어 이야기해보자. 혐오 발언이 사회적 문제로 떠오른 게 5~6년이 넘었다. 그런데 과연 언론에서 다룬 담론들에 구체적인 상황과 해결책이 담겼는지는 모르겠다. 혐오 발언이 나쁘다는 이야기는 누구나 할 수 있다. 내가 가진 관심사는 어떤 상황에서 혐오 발언이 늘거나 줄어들지에 관한 이야기다. 그 부분을 파악해야 혐오 발언을 제도적으로 해결할 수 있지 않겠는가.

데이터와 통계는 엄밀하게 활용하지 않으면 외려 오해의 씨앗이 되기도 한다.

당연히 객관적인 데이터 분석은 없다. 그럼에도 데이터 분석의 장점은 개념 공유와 합의가 가능하다는 지점에 있다. “어떤 정부가 들어선 뒤 한국의 민주주의가 무너졌다”는 문장이 있다고 해보자. 데이터가 없다면 ‘민주주의’라는 개념에서부터 대화를 시작해야 한다. 이야기가 진행될수록 원래 가졌던 질문은 사라지고 만다. 데이터로 접근하면 최소한 같은 이야기를 하면서 싸울 수 있다. 

조금 더 구체적으로 설명한다면?

이를테면 민주주의 지수는 언론의 자유나 시민 단체 등의 지표를 기준 삼아 각국의 민주주의 정도를 측정한다. 그렇다면 그 기준을 받아들일 것인지, 데이터 수집 과정에 문제가 없었는지 등으로 논의를 발전시킬 수 있다. 데이터를 기반에 두면 최소한 서로가 무슨 이야기를 하고 있는지 알 수 있다는 이야기다. 데이터 기반 분석의 장점은 객관적이고 공명정대하다는 것이 아니다. 말 그대로 언어가 통일된 상태에서 논의를 확장할 수 있다는 점이다.

“여성가족부 폐지” 발언 전후, 유저 단위 데이터 분석 그래프 ©언더스코어
그렇다면 여론과 혐오 발언 데이터를 분석하는 것에 있어서 원칙이 있다면 무엇인가.

여론과 반응 등을 분석할 때는 최대한 유저 단위의 데이터를 분석한다. 윤석열 대통령이 대선 후보 시절 “여성가족부 폐지”라는 한 줄 공약을 내세웠던 직후를 깔끔한 사례로 들 수 있을 것 같다. 여성가족부라는 헤드라인을 달고 있는 기사들을 분석할 때, 각 기사를 하나의 단위로 분석하면 통계적 착시에 빠질 수 있다. 그저 지금 뜨거운 이슈에 사람들이 몰려와서 혐오 발언이 증가한 것인지, 아니면 동일한 사람이 더 여성에게 적대적으로 변한 것인지 구분하기 어렵다. 

유저 단위로 접근하면 어떤 점이 유리한가.

유저 단위로 접근하면 보다 디테일한 분석이 가능하다. 윤 후보의 공약 이후 트래킹한 대부분의 유저에게서 여혐 발언이 크게 늘었다. 댓글 단위로 접근하면 애초에 이슈에 관심을 두고 있던 사람들이 분석 대상이 된다. 하지만 미리 유저 패널을 만들어 두고 사건에 따라 이들의 발언과 행동이 어떻게 달라졌는지를 파악하면 훨씬 더 강하고 구체적인 주장을 할 수 있다.

언더스코어는 데이터라는 흩어진 정보를 하나의 콘텐츠로 재생산한다. 데이터 저널리즘이라고도 부른다. 언더스코어가 지향하는 콘텐츠는 어떤 모습인가.

기존의 데이터 분석은 ‘당장 구할 수 있는 데이터’에서 출발하려 한다는 한계가 있었다. 가령 지면에 자주 등장하는 공직자 재산 공개는 정기적으로 발표되는 데이터다. 그런데 그 데이터를 가지고 뽑아낼 수 있는 콘텐츠와 통찰은 한계가 있다. 어느 정당의 누구는 돈이 많더라, 적더라, 이 정도이지 않나. 이게 식상해진 이유는 누구나 접근할 수 있는 데이터고, 또 누구나 생각할 수 있는 지점에 갇혀서만 이야기하기 때문이다. 이는 요리 콘텐츠를 기획하는 유튜버가 자기 냉장고를 열고 아이템을 고민하는 것과 마찬가지다. 그러면 콘텐츠가 이상해진다. 무엇이 궁금하고, 무엇이 필요한지에 대한 “질문”에서 시작해야 콘텐츠가 재미있어진다. 그냥 하는 건 없다. 데이터 분석에서도 항상 질문이 먼저다. 둘 사이가 전도되면 분석과 콘텐츠 모두 힘을 잃는다.
연령·성별 간의 상호작용 효과(interaction effect) 시각화 결과 ©언더스코어
굉장히 다양한 콘텐츠를 펴냈는데, 만족스러웠던 콘텐츠가 무엇인가.

미디어오늘에서 진행했던 포털 플랫폼 분석이 떠오른다. 언론을 소비하는 것에 있어서 포털 사이트가 문제로 지적되지 않나. 그런데 그 지적도 대부분 포털 중심의 미디어 소비를 경계해야 한다는 추상적인 구호에 그친다. 언더스코어는 포털 사이트의 정책 변경이나 UI 변경 등이 실제로 유저의 표현에 어떠한 영향을 미치는지 분석했다. 경향신문에서 펴낸 ‘두 얼굴의 공정’ 3부작 시리즈도 만족스러웠다. 이대남과 이대녀, 공정에 대한 이슈 등을 엮어 클래식한 사회과학적 방법론으로 풀어냈다. 진보와 페미니즘, 공정 등에 대한 사회의 통념을 깨는 콘텐츠였다고 생각한다.

지금 언론이 하지 못하는 걸 언더스코어가 한다는 느낌이 든다. 지금 언론의 문제는 무엇이라고 보나.

일단 기자들이 쓰는 기사의 양이 너무 많다. 하루에 두 편, 세 편의 기사를 쓴다. 사실 간단한 글을 쓰는데도 시간이 걸리지 않나. 하루에 세 편씩 기사를 쓰면 심층 취재를 할 시간이 없다. 기자 개인의 역량 부족 문제가 아니라, 지금의 언론사 환경이 전문성 있는 취재를 하기 쉽지 않다. 심층적인 이야기를 풀어낼 수 없으니 지식 셀러브리티나 대중적으로 잘 알려진 전문가의 의견에 의존하게 된다. 

그렇다면 대안이 있을까.

개인적으로는 언더스코어와 같은 서드 파티 업체가 언론사에 많이 들어가는 구조가 좋을 것이라고 생각한다. 언론사도 플랫폼 역할을 할 수 있다. 한국에 좋은 콘텐츠는 결코 부족하지 않다. 다만 지금의 언론에 가지 않을 뿐이다. 미디어 스타트업들이 서드 파티로 언론 플랫폼에 진입해 다양한 이야기를 풀어가는 것도 좋은 방향이라고 생각한다.
댓글로 보는 여론 ©폴리스코어
언더스코어가 계획 중인 프로젝트가 궁금하다.

콘텐츠로는 영상 분야를 더욱 확장해보려 한다. 지금까지는 모션 그래픽을 위주로 이해도를 높였는데 실사 촬영을 함께 해보려고 한다. ‘복스 미디어(Vox Media)’처럼 모션 그래픽과 실사 모두를 써서 커다란 주제를 포괄해보려고 시도 중이다. 기사만 읽었을 때 이해가 쉽지 않았다면 그 분량과 포맷 안에 담기기 힘든 이야기라 그렇다고 생각한다. 한 권 분량의 책으로 보면 훨씬 쉬울 것이고, 3분 분량의 영상보다 10분 분량의 영상이 훨씬 쉬울 것이다. 분량을 늘릴 때 호흡을 조절할 수 있도록 인터뷰 등을 넣어보려고 한다. 최근에는 시즌 에피소드 형식으로 대 주제를 정해놓고, 각 주제마다 세부 내용을 에피소드 형태로 다루는 콘텐츠를 만들어보려 한다. 관련해서 몇몇 대학과 이야기를 나누고 있다. 

데이터 분야에서의 비전도 궁금하다.

데이터 분석 분야로는 솔루션 쪽을 강화하려 하고 있다. 선거 시즌에는 SBS에 ‘폴리스코어(Poliscore)’라는 솔루션을 제공했다. 곧 론칭하게 될 건 기업의 ESG 여론 관련 트래킹 분야다. 많은 사람들이 데이터는 사이언스로, 영상은 아트로 분리해서 생각한다. 하지만 데이터와 영상 모두 콘텐츠다. 궁극적으로는 더 많은 이들이 양질의 콘텐츠를 접했으면 한다.

김혜림정원진 에디터

* 2022년 11월 8일에 이메일로 전해 드린 ‘북저널리즘 톡스’입니다. 다르게 생각하는 사람들의 인터뷰를 메일함에서 바로 받아 보시려면 뉴스레터를 구독해 주세요. 뉴스레터 구독하기
Close