Showing posts with label 정보의 과학. Show all posts
Showing posts with label 정보의 과학. Show all posts

Tuesday, May 22, 2018

끔 약을 먹어야 하는 사람에게는 모를 수 있지만 매일 약을 먹어야 하는 사람들은 오늘 아침에 약을 먹었는지 안 먹었는지 잊을 때가 있다. 잠에서 깨어 습관적으로 먹고 잠들었다가 꿈에서 먹었는지 진짜 먹은 것인지 모를 때도 있다. 그래서 요일별로 7개의 칸이 나누어진 약 상자에 넣어두고 오늘 요일에 해당하는 약이 있는지 없는지를 확인하고 먹을 때도 있다. 저녁 약을 먹어야 한다면 비슷하다. 저녁에 약을 먹었는지 아닌지 알지 못할 때가 있다. 요일별로 나누어진 약상자를 가지고 다니면 좋지만 일주일에 한번 일주일 약을 챙기는 것도 귀찮을 때가 있다. 요일 별 상자도 좋지만 저녁에 먹어야 하는 약이 4개 정도라면 4칸 혹은 아예 나누어지지 않은 약 상자를 가지고 다니면서 오늘 저녁 약을 먹었는지 아닌지 확인할 수 있는 방법은 없을지 생각해 본다.


습관적으로 매일 아침, 저녁으로 먹어야 하는 사람에게 약을 먹으라고 알람을 울리는 것도 좋은 방법이다. 지금 하고 있는 일이 있어서 나중에 먹어야 겠다 마음먹고는 잊어버리는 경우도 있고 방금 전에 먹었는지 아닌지도 확실하지 않을 때도 있다. 요일별로 나누어진 약 상자라면 오늘 요일을 확인하면 되지만 만약 요일별로 있지 않을 때도 방법이 있다. 약 상자에 약을 넣을 때 7의 배수로 넣는 것이다. 7개, 14개 약이 작다면 21개 이런 식으로 넣는다. 저녁 약을 잘 먹어오다가 목요일 저녁에 약을 먹었는지 아닌지 모르겠다면 남아 있는 약을 세어 보고 만약 3개, 10개가 남았다면 먹은 것이고 4개, 11개가 남았다면 목요일 저녁에 약을 아직 먹지 않은 것이다.

알약의 개수는 데이터이다. 몇개가 남았는지는 우리에게는 그냥 주어지는 데이터일 뿐이지만 요일 정보와 결합이 될 때 우리가 무엇을 했는지 아닌지를 알 수 있는 개인에게 관련된 정보가 되는 것이다. 데이터는 단순한 숫자 혹은 문자열일 수 있지만 데이터가 개인의 상황 혹은 조건과 결합이 되면 개인에게 의미가 있는 정보가 될 수 있다. 알약의 예에서 3개, 10개가 남은 것은 단순한 데이터이지만 이것이 목요일이라는 정보 그리고 매일 약을 먹는 사람이라는 상황이 결합이 되면 개인이 약을 저녁에 먹었는지 아닌지 알 수 있게 된다. 데이터란 무엇이며 데이터가 가지는 힘, 그리고 그 힘이 우리에게 어떻게 다시 영향을 줄 수 있는지를 이해하는 것은 정보의 바다에서 최소한 익사하지 않기 위한 구명정이라 생각하게 된다.


Datum Era ...

데이터는 번역하면 단순하게 자료로 번역되지만 단순히 조금 부족한 느낌이 들기 때문에 외래어로 데이터로 사용할 것이다. 데이터의 어원은 라틴어 datum 그리고 datum 은 '주다'는 뜻의 dare 에서 유래되었다. 무엇인가를 설명하기 위한 기초적인 자료 누군가를 설득시키기 위해 필요한 모든 자료들을 데이터라고 말하고 수리적으로 계산하기 위한 대상이기도 하다. 예를 들어 건물의 높이를 측정하기 위해서 높이가 몇 m 이고 넓이는 어느정도라고 말하는 대부분의 숫자들은 우리가 건물의 규모를 이해하기 위해 필요한 숫자들이다. 그리고 그 숫자를 통해서 건물의 가치가 어떻게 된다와 같은 논리적인 내용을 이어가기 위한 내용들이다. 쉽게 이해할 수 있지만 실제로 데이터는 숫자 그리고 간단하게 교환될 수 있는 문자 정도로 구성되어 있다. 대부분이 숫자이고 컴퓨터의 발달로 문서 내용이나 사진, 음원 등과 같은 거의 모든 내용들은 0, 1 로 이루어진 숫자로 표현이 가능하게 되었다.

간단하게 모든 데이터는 숫자로 표현할 수 있게 되었다고 설명할 수 있지만 중요한 것은 이렇게 표현된 숫자들이 우리의 삶에서 중요한 의사결정을 하는데 무엇을 평가하거나 계획하는데 필요한 숫자들이라는 점이다. 조금 과장해서 이 세상이 0, 1 로 이루어졌다고 할 수 없지만 0, 1에 의해 세상이 움직일 수 있다고는 말할 수 있을 것이다. 영화 매트릭스 (1999) 는 우리가 살고 있는 세상도 실제로 존재하는 곳이 아닌 데이터로 이루어진 곳이며 우리는 그것을 인식하지 못하고 살아갈지 모른다고 이야기해주었다. 소위 빨간약 / 파란약의 선택에서 파란약을 먹는다면 예전처럼 살던 모습대로 살아가고 빨간약을 먹게 된다면 매트릭스 그리고 데이터가 만들어 놓은 실제 세상에서 싸우게 되는 것이다. 파란약을 먹고 망각과 평온의 세상을 살게 될지 빨간약을 먹고 자각과 고통의 세상을 살 것인지 선택하게 된다. 매트릭스처럼 모든 것이 데이터로 이루어진 세상에 허구로 살아가는 존재는 아니지만 우리가 무의식 속에서 흘러가는 수많은 데이터들을 인식하게 되는 순간 세상은 우리가 생각하는 것만큼 데이터의 주인은 우리가 아니라는 사실을 알게 될 것이다. 그래서 영화 매트릭스가 우리에게 전해주고 싶은 이야기는 허구 / 실체의 구별이 아니라 우리가 얼마나 많은 데이터를 만들어 내고 개인정보들이 흘러 나오지만 우리는 그 데이터의 흐름을 인식하지 못하고 있는지 알려주고 싶었는지 모른다.

매트릭스 (1999)

다시 정리하자면 데이터는 의미없는 숫자나 정보까지도 모두 다 포함한다. 그러나 데이터가 조건 condition 과 상황 circumstance 과 결합이 되면 개인정보가 될 수 있다. 앞서 설명한 것처럼 약의 개수는 단순한 데이터지만 약을 매일 먹는다는 조건과 약을 7의 배수로 상자에 넣은 상황이 결합되면 오늘 약을 먹었는지 아닌지 알 수 있게 된다. 우리가 민감하게 생각하는 개인정보 privacy 란 데이터와 조건, 상황이 포함된 결과물이다. 모든 데이터가 개인정보는 아니지만 모든 개인정보는 데이터라고 말할 수 있다. 개인정보의 저장, 전달 및 가공의 단계를 고려해서 우리가 만든 데이터들이 얼마나 많은 개인정보로 전달 가공될 수 있는지 생각해 볼 필요가 있다.


Data Tsunami ...

개인은 얼마나 많은 데이터를 만들고 있고 내가 만든 데이터는 모두 나의 개인정보가 되는지 그리고 내가 만들지 않은 데이터가 나의 개인정보가 될 수 있는가 고민하지 않는다. 특별히 내가 만드는 데이터가 많지 않을 것이라는 생각과 함께 내가 만든 데이터가 중요하지 않을 것이라고 생각하기 때문이기도 하다. 그러나 결론부터 말하면 데이터의 가치는 중요하지 않다. 다시 강조하지만 데이터가 어떻게 개인정보를 포함해서 어떻게 중요한 정보가 될 수 있는지는 조건과 상황에 따라서 달라진다. 냉전시대 인터넷이 중요하지 않은 시절에는 인터넷을 연결할 수 있는 정보 그리고 관련된 데이터는 분명 중요하다 못해 극비 데이터였지만 이제는 누가 가지라고 해도 쓸모없는 데이터이다.

가장 많은 실수 중 하나는 데이터를 만들 때부터 중요한 데이터 / 중요하지 않은 데이터와 같이 가치 판단을 해서 선별해서 만들려고 한다는 점이다. 그러나 데이터는 많으면 많을수록 좋고 데이터가 가지는 조건과 상황을 같이 고려한다면 우리에게 중요한 정보들이 만들어 질 수 있다. 따라서 데이터의 초기 생성 단계부터 데이터의 가치를 판단한다는 것은 다이아몬드 원석을 찾으면서 반짝이는 것만을 찾는 것과 비슷하다. 컴퓨터나 전자 기기가 많이 보급되지 않은 시절에는 어떤 데이터를 수집할 것인지 선택해야지만 한정된 자원으로 원하는 데이터를 모을 수 있었지만 이제는 그럴 이유가 없어졌다. 움직이지 않아도 내 곁에 있는 핸드폰은 끊임없이 내가 어디에 있고 (정확하게 핸드폰이 어디에 있고) 필요하다면 어떤 소리가 나는지 어떤 뉴스가 전달되는지 끊임없이 데이터를 주고 받는다. 그리고 그 데이터 안에는 이미 가공되어 가치가 있다고 생각되는 정보들도 많이 전달된다. 예를 들어 가치있다고 믿는 뉴스가 나에게 전달되었을 때 읽지도 않고 그냥 지워버렸다면 지워버리는 행동 안에도 사용자는 아주 잠깐동안 읽었다 (실제로는 읽지 않았다) 지워버렸다는 데이터가 발생하고 이 데이터를 사용자는 해당 뉴스에 대해서 관심이 별로 없다는 정보를 얻을 수 있다. 반복적으로 스포츠 뉴스에 대해서 읽지 않고 지워버린다는 행동들이 데이터로 모이게 된다면 해당 사용자는 스포츠에 대한 관심이 크지 않다는 정보를 얻게 된다.


이처럼 우리는 별 생각없이 움직이고 반응하고 행동하지만 이 모든 행동들은 핸드폰과 같이 수많은 센서들이 있는 기기를 통해서 상상하지도 못하는 수많은 데이터들이 만들어진다. 다른 예를 들어보자. 반대로 거의 모든 차량에 있는 영상기록장치 (블랙박스) 는 데이터인가 개인정보인가 묻는다면 거의 대부분은 개인정보라고 대답할 수 있지만 해당 영상기록이 누구의 것인지 모르게 인터넷에 그냥 떠돌아 다닌다면 그것은 개인정보이기 보다는 그냥 단순한 데이터라고 말하는 것이 더 정확할 것이다. 누군지 알 수 없고 그리고 특별한 사고 기록이 있어서 더 이상 알 필요가 없이 정상적으로 잘 주행한 영상기록이라면 개인정보의 가치를 가지지 않을 것이다. 다만 대부분의 영상기록 데이터는 누구의 것이라 내용을 알기 때문에 바로 '누구의 것'이라는 소유의 조건이 포함되어 개인정보가 되는 것이다.


Privacy manufacturer ...

소위 음란물 영상에서 사람들이 중요하게 생각하는 것이 무엇일까? 이 질문에 정확하게 대답하기 위해서는 음란물을 탐독하고 그들의 세상에서 접근하는 것이 중요하지만 그렇게 하고 있다고 해도 그렇고 그것을 위해 탐독한다고 해도 좀 그렇다. 간접적으로 알 수 있는 방법은 사람들이 많이 찾는 제목이나 내용을 통해서 찾아보는 것이다. 개인의 성적 흥분만을 위해서 음란물이 필요하다면 누군지 알 수 없이 알몸만 나온 영상으로 성적 행위를 보여주면 될 것같은데 음란물을 탐독하는 제목은 이상하게 등장인물에 더욱 집중하는 경향을 보인다. 인종별로 분류하거나 얼굴이 나왔는지 심지어 영상에서는 알 수 없는 두사람의 관계에 대해서도 친절하게 설명한다. 음란물의 가장 큰 문제는 결국 영상 데이터가 누구인지 특정될 identify 수 있는 개인정보가 된다는 점과 정확한지 알 수 없는 그리고 알 필요도 없는 수많은 잘못된 조건과 상황이 결합되어 막기 힘든 개인정보가 되어버린다는 점이다. 음란물이 사회적 문제가 된다는 공감대를 가지는 가장 큰 이유는 개인정보 뿐만 아니라 그 개인정보가 전달 속도와 힘이 무섭다는 점이다.

음란물은 아니지만 우리는 수많은 개인정보를 만들어 내고 있다. 개인은 단순히 데이터를 만들고 있다고 생각하지만 인터넷은 충분히 그런 데이터를 개인정보로 만들고 있다. 우리가 사용하는 많은 인터넷 서비스들은 다른 의미에서 우리가 의미없이 만들어내는 데이터들을 개인정보로 가공하는 공장과도 같다. 예를 들어 인스타그램 Instagram 에 수많은 사진들을 올린다. 올리는 순간에는 단순히 데이터지만 개인의 계정을 통해서 전달되기 때문에 자연스럽게 바로 개인정보가 된다. 반대로 개인을 특정하기 힘든 광고 목적으로 만들어진 계정에서 올린 데이터라면 개인정보라고 보기 어려운 데이터도 존재할 것이다. 자기 가족의 사진을 올리는 경우를 자주 볼 수 있다. 공개로 올린 단란한 사진들 속에는 누가 아버지고 누가 어머니고 누가 자식인지 모두 보여준다. 나쁜 맘을 먹는다면 아이들을 납치하고 정확하게 몸값을 요구해야 하는 부모가 누구인지 알 수도 있고 아버지를 납치하기 위해 자식이나 부인에게 가족여행 당첨되었다며 유인할 수도 있을지 모른다. 심지어 인스타그램을 포함한 많은 소셜 미디어는 태그를 통해서 더 특정할 수 있다. 예를 들어 #지역맘 과 같이 특정 지역이 포함된 그리고 육아를 시작한 인물들을 찾아내기 쉬울 뿐만 아니라 오히려 그렇게 찾도록 스스로 태그를 올리기도 한다. 마음만 먹는다면 특정 지역에 육아에 몰두하는 엄마를 찾을 수도 있고 자식이 어떻게 생겼는지도 쉽게 파악할 수 있다.


반대로 자신이 소비하고 즐기는 생활 수준을 자랑하고 싶을 수도 있다. 물론 그렇게 자랑하는 것이 나쁘다고 할 수 없지만 자랑하고 싶은 소비 수준뿐만 아니라 삶의 동선까지도 쉽게 노출시킨다. 어느정도 그런 부분을 노출시킬 수 밖에 없기도 하고 광고나 홍보 목적으로 사용한다면 적극 노출되게 해야겠지만 개인의 삶까지도 광범위하게 노출시켜야 하는지 의문스럽다. 오히려 그렇게 노출되는 범위는 결국 피해볼 수 있는 위험을 높여주기 때문이다. 미국의 정보기관에 들어간 기쁨에 자신의 계정에 정보기관 신분증을 공개된 계정으로 올린 정말 이해할 수 없는 사람이 있었다. 물론 그 기쁨과 함께 기관 신분증 이미지를 올린 것만으로 바로 해고되었지만 종종 출입증과 같이 중요한 정보를 가지는 데이터를 아무렇지 않게 올리는 사람들이 있다. 친절하게 자신의 사진이나 이름 정도는 지우고 올리기에 개인정보가 아닌 단순히 데이터라고 할 수 있지만 동일 기관에 대한 출입증 이미지만 모아보면 위조 신분증을 만들 수 있는 좋은 데이터가 될 것이다.

개인정보의 노출 위험성을 인식하고 조심하는 대표적인 경우가 택배 도착의 기쁨을 알리는 사진일 것이다. 열심히 자신의 주소, 이름 등 개인정보가 될 것 같은 부분을 열심히 지우고 올리지만 정작 바코드는 너무도 선명하게 보인다. 바코드를 읽어서 해당 택배 회사에서 송장번호로 검색하면 생각보다 많은 개인정보가 나온다는 것을 알게 된다. 열심히 숨겨온 개인의 주소도 노출될 수 있고 개인이 올리는 지역의 정보을 모아보면 개인의 동선 뿐만 아니라 조금 더 노력하게 된다면 개인 거주지까지도 알아낼 수 있다. 가끔 #삭제예정 이라는 태그로 올라오는 공개 사진들을 보면 자신의 계정에서 삭제되면 정말로 인터넷에서 삭제될 것이라고 믿는지 모르겠다. 여러가지 목적이 있지만 이처럼 인스타그램에서 공개된 사진들이 거의 실시간으로 수집된다. 그래서 #삭제예정 이지만 이미 #공개완료 라는 사실도 인식해야 한다.


What machine does better ...

인공지능 Artificial intelligence 이 관심의 중심에 놓이면서 항상 재미처럼 붙는 주제가 바로 인공지능이 빼앗아갈 인간의 직업이다. 어떤 직업은 인공지능에 의해서 사라지게 될 것이다. 어떤 분야는 인공지능이 인간보다 더 잘할 것이라고 예상하지만 아직 제대로 존재하지 않는 인공지능의 직업을 사라지게 할 것이라고 말하기도 한다. 인간의 관심사에는 어떤 직업 job 이 사라지게 되는지가 중요할 것이다. 인공지능의 시대에는 선택하지 말아야 하는 혹은 선택할 수 없는 직업이라고 생각하기 때문이다. 그러나 인공지능 더 현실적으로 보아서 직업의 관점이 아니라 작업 work 더 구체적으로는 작업내용 workflow 의 관점에서 생각해 볼 필요가 있다. 알파고 AlphaGo 가 보여준 것처럼 인간과 기계의 대결에서 누가 이기는지가 중요한 것이 아니라 기계가 인간보다 더 잘하는 내용을 찾아야 하는 것이다. 그리고 기계가 잘하는 작업내용을 통해서 기계에게 양보해야 할 내용은 무엇인지 인간이 계속 해야만 하는 것이 무엇인지 결정해야 한다.

우선 인간의 의사 결정 decision making 과정이 정말 논리적이고 합리적인지 생각해 보자. 회사의 최고 경영자나 나라의 지도자 아주 사소한 결정을 내려야 하는 위치에 있는 어떤 사람들도 자신의 선택이 항상 합리적이라 모든 이들이 이해하고 따를 수 있기를 바라지만 현실의 많은 부분은 그렇지 않다. 처음부터 인간의 의사 결정 과정이 정말 합리적인지 의심해야 한다. 많은 자료를 모으고 어떤 결정이 가장 최선의 결과를 얻을 수 있는지에 대해서 고민하지만 종종 인간의 결정은 아주 사소한 그리고 감정적인 선택을 하게 되는 경우를 종종 보게 된다. 단적으로 모든 인간이 객관적 자료에 의해 합리적으로 모두 결정하게 된다면 누군가를 설득시키는 작업도 회사에서 마케팅의 역할도 크게 필요하지 않을 것이다. 그러나 합리적 판단을 위한 충분한 자료 혹은 데이터를 얻지 못하는 경우도 존재하고 잘못된 데이터 혹은 목적을 가지는 데이터를 통해서 잘못된 선택을 하게 되기도 한다. 경영을 잘하기 위해서 도입되는 경영정보시스템 MIS: Management Information Systems 부터 의사결정지원 Decision making support 시스템은 사실상 인간이 좀 더 합리적으로 판단하기 위해서 필요한 데이터를 어떻게 잘 모을 수 있는지 도와주는 것이다. 그러나 결국 마지막 선택은 그 모든 데이터와 분석에도 불구하고 인간이 한다.

출처: IoT for all - https://www.iotforall.com

그래서 모든 직업에서 이루어지는 구체적인 작업내용 workflow 상에서 데이터를 모으고 분석하는 단계는 기계가 인간보다 더 잘할 수 있다고 생각했다. 그러나 현실적으로 그 모든 데이터들은 대부분 인간이 입력해야 하기 때문에 어떤 데이터를 입력하게 되는지도 인간의 의도 bias 가 들어가게 되었다. 그래서 인간은 데이터를 입력하기 보다는 무엇인가 가치판단이 포함되어 선택된 정보가 입력되기 쉬었다. 즉, 인간에게 가치있어 보이는 정보를 만들기 위한 수많은 데이터들은 인간이 보고, 듣고 (혹은 느끼고) 판단하고 필요한 정보로 만들어서 가공해서 만드는 작업을 중요하게 생각했다. 수많은 데이터가 아닌 인간이 한번 분석해준 정보로 판단하고 싶은 것이다.

예를 들어 '요즘 유행하는 혹은 앞으로 유행할 패션은 어떤 것인가?' 라는 질문을 받게 된다면 패션 종사자들은 사람들이 입고 다니는 옷들부터 전문가들의 의견 등 다양한 데이터 혹은 정보를 얻어 결론을 내고 싶을 것이다. 그러나 만약 분석하려는 인간이 자신이 자주 다니는 장소만으로 선택해서 이 지역이 유행하면 전국적으로 유행할 것이라는 가정을 통해서 한 지역만을 조사하거나 인터넷에 나오는 많은 패션 사진을 찾아 보지만 실제로 자신의 기호 혹은 선호도 preference 없이 객관적으로 사진을 모을 수 있을지 그리고 그 결과가 어떨지는 알 수 없다. 그러나 기계가 이런 작업을 수행하게 한다면 최근 패션에 관련된 사진들과 소셜 미디어에 올라오는 사람들의 일상 속에서의 패션들을 모아서 옷에서 나타나는 수치들 예를 들어 원피스의 경우 위와 아래가 구분되는 비율이나 옷의 형태뿐만 아니라 일상에서 어떤 옷을 입고 어떤 장소에 자주 간다와 같이 옷 뿐만 아니라 관련된 배경정보들까지도 포함해서 포괄적인 데이터를 분석할 수 있다. 뿐만 아니라 거의 실시간으로 데이터를 추가할 수 있기도 하고 인간이 궁금해 하는 부분들도 바로 분석할 수 있는 능력을 가진다. 기계가 인간보다 충분히 잘 할 수 있는 부분은 데이터가 많아진다면 그 데이터를 모아서 인간이 원하는 질문에 대답하기 위한 시간이 절약된다. 예를 들어 야외에 나갈 때 선호하는 패션은 무엇인지 물어본다면 인간은 다시 야외라는 조건을 포함해서 해당되는 데이터를 다시 보아야 하겠지만 기계에게는 그런 데이터를 처리하는 시간뿐만 아니라 결정적으로 인간이 제시할 수 있는 다소 모호한 그리고 광범위한 대답 예를 들어 "내년에는 무채색의 정장 스타일..." 과 같은 내용이 아니라 기계는 명도 채도 그리고 스커트의 길이는 어떤 비율과 같이 수치화 된 quantified 새로운 정보를 제시할 수 있을 것이다.

A P P A R E L – Clothing in the age of data accumulation and machine learning.
원문: https://meson.in/2s1GV4x

결국 기계가 인간보다 더 잘 할 수 있는 작업내용을 생각해보면 역시 데이터를 얻어내고 분석하고 이를 수치화 하는 작업을 우선 생각할 수 있다. 역시 좋은 목적으로 기계의 수집, 분석 능력을 사용할 수 있지만 개인이 인지하지 못하고 만들어 내는 수많은 데이터를 개인정보로 만들어 내는 작업도 분명 기계가 탁월하게 할 수 있을 것이다. 예를 들어 특정 인물이 어떤 곳에 살고 있고 가족 관계가 어떻게 되고 아이는 어떤 유치원에 다니는지 우리는 수작업으로 관음증 환자처럼 찾아내야 하는 작업들을 기계는 아주 쉽게 그리고 죄책감도 거의 가지지 않고 쉽게 할 수 있을 것이다.


Such a trivial data ...

대한민국은 주민등록 번호 하나로 수많은 개인정보를 얻어 낼 수 있는 무서운 국가 중 하나이다. 물론 국가가 국민을 쉽게 통제할 수 있는 수단으로 그리고 어떤 측면에서는 범죄자를 쉽게 찾아낼 수 있는 좋은 수단이라고 변호할 수 있지만 범죄자를 위해서 수많은 비범죄자의 개인정보까지 들춰질 권리까지 국가가 가져야 한다고 주장할 수 없다.

한국에서는 수많은 카페나 공공장소에서 인터넷을 쓸 수 있다. 예를 들어 카페에서 접속할 수 있는 소위 비밀번호 (정확한 의미에서 비밀번호는 아니다.) 를 입력하면 무선인터넷을 사용할 수 있다. 그러나 그와 함께 카페의 내부 인터넷에 들어갈 수 있다 혹은 공유기에 접속한다는 말이다. 그리고 공유기 관리를 위한 페이지에 접근할 수 있다. 공유기의 관리자 암호/패스워드가 기본값이라면 카페 관리자가 아니라도 쉽게 관리화면에 들어가서 수많은 설정을 바꿀 수 있다. 이론상 (그리고 현실상) 외부에서도 접근이 가능하다는 말이다. 그리고 공유기 설정값이 기본값으로 되어 있다면 수많은 공유기에 접근해서 원하는대로 설정을 바꿀 수 있다. 가장 쉽게 DNS 를 바꾸는 것을 생각할 수 있다. DNS 는 인터넷의 주소록이다. [ 인터넷의 주소록 DNS 서비스 ─ 기반기술에 대해서... ] 예를 들어 은행 업무를 위해서 yourbank.com 을 입력할 때 해당 도메인 이름이 어디에 있는 서버인지 알려주는 주소록이 DNS 인데 이 DNS 에서 yourbank.com 가 자신들이 만든 은행처럼 보이는 곳으로 알려주어 접근하게 한다. 잘못된 DNS 정보로 들어간 사용자는 자신은 은행업무를 본다고 생각하지만 가짜 은행 사이트에서 자신의 개인정보를 입력하게 된다.

일반 가정집에서 사용하는 공유기에 중국 (124.94.30.252) 에서 들어오려고 한다. 공유기의 비밀번호 기본값을 통해 들어오려는 시도를 쉽게 볼 수 있다. 

실제로 내부 인터넷에 들어간다는 것은 외부에서 접근하는 것과는 차원이 다른 많은 부분들이 노출될 수 있다. 대표적으로 CCTV 도 들어가서 볼 수 있다. 인터넷을 제공하는 많은 곳에서 이처럼 자신의 공유기를 제대로 관리하지 않거나 CCTV 도 쉽게 기본값으로 들어갈 수 있는 곳을 자주 볼 수 있다. 종종 이런 이야기를 해주지만 대부분의 반응은 "별로 중요한 것도 없는데요." 혹은 "뭐 볼게 있겠어요." 라고 크게 무서워하지 않는 경우가 대부분 이었다. 그러나 대한민국이 아닌 다른 나라에서 이런 가능성에 대해서 이야기하면 상당 부분 놀라는 경우가 많았고 싱가포르와 같은 나라는 자신의 인터넷을 공개하거나 이렇게 위험에 노출시키면 안되도록 규제하고 있다. 권한이 없는 혹은 주인이 아닌 사람이 들어와서 영상 자료를 보는 것이 무엇이 문제일까 싶지만 개인적으로 생각한 창의적인(?) 생각은 노트북 쓰는 사람의 화면이나 키보드 입력 모습을 통해서 충분히 암호도 알아낼 수 있을 것이라고 생각했다. 실제로 공공장소에서 전혀 모르는 사람이 누구인지 그 사람의 소셜 미디어 계정을 찾아내는 방법은 다양하다. 책에 적어놓은 학번 / 이름 을 통해서도 알 수 있고 옆자리에 앉아 로그인하는 화면에서 이름이 누구인지 알 수도 있고 가끔 거울이나 물건 등에 반사되어 보이기도 한다. 지하철에 서서 가면 앞에 앉아 있는 사람이 무엇을 하고 있는지 시력이 좀 더 좋다면 그 사람의 계정 이름도 알아낼 수 있다.


유명한 사람도 아니고 내 개인정보가 뭐 중요하겠어 라고 생각할 수 있다. 대규모 서버에 공격하는 사람들도 많지만 의외로 전혀 들어올 이유가 없는 아주 사소한 서버에도 공격하는 사람들이 많다. 우리가 느끼지 못할 뿐이지 정말 정체를 알 수 없는 수많은 공격자들은 개인 서버인지 그냥 가정집 공유기인지 생각하지 않고 무조건 공격하는 경우를 자주 볼 수 있다. 개인적으로 관리하는 곳들은 모두 공유기에 접근하려다 실패하는 내용을 보지만 만약 공유기 관리 화면에 기본값으로 접근할 수 있다면 아마 공격자들이 의도한대로 접근해서 자신들이 원하는 작업을 했을 것이다.


How to protect privacy ...

무선랜을 사용하기 위해서 무선랜 비밀번호를 입력한다고 말하지만 정확히 이는 비밀번호는 아니다. 내가 접근하고 싶은 무선랜 이름 (SSID: service set identifier) 를 선택하면 네트워크 보안 키 를 입력하라고 나온다. 소위 '무선랜 비밀번호'는 키 key 이다. 간단하게 설명하면 우리가 입력하는 '비밀번호'는 무선랜을 써도 좋다는 허락을 위한 암호가 될 수도 있지만 사용자의 기기와 공유기가 데이터를 주고 받을 때 전달되는 데이터가 암호화가 될 수 있는 열쇠와 같은 것이다. 예를 들어 내가 데이터를 보낼 때 가장 먼저 공유기에 전달이 되어야 하는데 공유기에 전달되기 전에 내가 보내는 데이터를 '미리 정한(공유한) 키 Pre-Shared Key' 를 통해서 암호화를 해서 보내니 공유기 너는 이 키를 가지고 암호화한 데이터를 풀어서 받아 라고 규칙을 정한 것이다. 간단히 정리하면 사용자의 기기와 공유기 사이에 전달되는 데이터가 암호화하기 위한 것이다. 그래서 공개되어 '비밀번호가 없는' 무선랜은 그 사이에 전달되는 데이터가 암호화되지 않은 상태로 전달된다는 것이다.

데이터가 암호화되고 암호화되지 않은 것에 대해서는 조금은 민감할 필요가 있다. 옛날에는 안방에서 엄마가 전화하고 있으면 다른 방에서 수화기를 몰래 들어 통화를 감청(?)할 수 있었다. 마찬가지로 두 사람이 통화하는 중간 어딘가 똑같이 신호를 받아서 들을 수 있다면 같은 집 수화기를 통하지 않고도 들을 수 있다. 인터넷 데이터도 마찬가지이다. 암호화되지 않은 데이터는 어딘가에서 똑같이 받을 수 있다. 즉, 전달과정에서 동일한 데이터를 여러 곳에서 얻게 된다. 암호화가 되지 않았다면 내가 보내는 데이터 - 채팅 내용, 비밀번호, 주소록 등 - 모든 데이터 내용이 그대로 알아 볼 수 있는 형태로 얻게 된다. 그러나 만약 보내는 A 와 받는 B 둘만이 어떤 키를 가지고 있고 A 가 그 키를 통해서 보내는 데이터를 암호화해서 보내고 B 는 받은 데이터를 미리 공유된 키를 가지고 암호를 풀면 (복호화) 아무리 중간에 데이터를 얻게 된다고 해도 중간에서 데이터를 몰래 볼려고 한 사람은 암호화되어 알아낼 수 없는 데이터만 얻게 되는 것이다. 그래서 공개된 무선랜에 접속해서 인터넷을 쓴다는 것은 최소한 같은 공유기 내에 있는 사람에게는 암호화되지 않은 데이터를 누군가 몰래 볼 수 있다는 말이다.


인터넷에서 데이터 암호화는 상당히 중요하다. 그래서 이제는 거의 모든 웹서비스는 기본적으로 데이터 암호화 기술을 적용해서 사용하게 한다. 인터넷 주소창에 http:// 로 시작하는 주소와 https:// 로 시작하는 주소를 볼 수 있다. http:// 는 공개된 무선랜이라 생각하면 된다. https:// 는 사용자와 서버 사이의 데이터를 암호화해서 전달한다고 생각하면 된다. 다시 말해 http:// 를 보고 입력하는 정보들은 전달되는 과정에서 암호화되지 않은 상태 그대로 누군가에 의해 노출될 수 있다. 반면 암호화가 되어 있는 서버 사이에서는 내가 입력한 정보들은 암호화가 되어서 중간에서 데이터를 가져가도 암호화된 데이터만 가져가 제대로 된 키가 없다면 제대로 된 정보를 얻어낼 수 없다. 그래서 암호화된 주소 https:// 를 가지는 웹서비스만 사용하도록 습관을 가지는 것이 좋다. 조금만 관심을 가지고 보면 알겠지만 대부분 주요 서비스들은 암호화는 기본이고 데이터 암호화 통신의 중요성을 인식하고 있는 단체를 중심으로 개인들도 암호화를 쉽게 그리고 비용없이 적용할 수 있도록 도와주고 있다. 가장 대표적인 곳이 Let's Encrypt 이고 개인도 간단한 설정만으로 적용할 수 있다. 그리고 많은 기업들은 데이터 암호화가 기본이 될 수 있도록 필요한 비용과 지원을 하고 있다. 그만큼 우리가 일상적으로 사용하는 데이터가 누군가에 의해서 탈취당해서 악의적으로 사용될 가능성, 아무리 '사소한' 개인의 데이터라고 해도 보호되어야 한다는 철학을 가지고 있는 것이다.


데이터 암호화가 적용되었는지 아닌지 살펴보면서 인터넷을 돌아다니다 보면 대한민국의 주요 기업들은 여전히 부족하다는 것을 알게 된다. 심지어 인터넷이 사업의 중심인 회사들조차도 자신의 서비스를 제대로 된 암호화를 제공하지 않고 서비스하는 것을 볼 수 있다. 알 수 없는 회사의 심오한 경영 철학이 있다면 할 수 없지만 개인 데이터의 중요성을 누구보다 잘 알고 있고 그런 사용자의 데이터가 어떤 기업보다 기업 경영의 자산인 기업에서 이렇게 보호되지 않는 웹서비스를 한다는 것은 조금 이해하기 어렵다. 뭔가 이해할 수 없는 심오한 그리고 기술적 진보로 암호화되지 않은 인터넷 환경에서도 개인의 데이터를 보호할 수 있는 최첨단 기술이 존재할 것 같지도 않다.


Less better than more ...

보안에서 한가지 원칙은 자신의 민감한 정보들은 자주 입력하지 않는 것이다. 예를 들어 브라우저에 비밀번호를 저장하고 들어갈 때마다 브라우저에서 비밀번호를 넣어주는 것과 들어갈 때마다 사용자가 비밀번호를 입력하는 것 중에서 어떤 것이 더 안전한지 묻는다면 대부분 브라우저에 자신의 비밀번호가 저장되어 있다는 사실때문에 매번 비밀번호를 입력하는 것이 더 안전할 것이라고 생각할 수 있다. 그러나 사용자가 키보드나 터치스크린을 통해서 입력하는 과정에서 발생할 수 있는 시각적인 해킹 - 사용자가 키보드를 입력하는 움직임을 통해서 비밀번호를 알아내는 - 이나 키보드 로그 - 키보드의 기록값을 몰래 저장하는 - 를 통해서 유출될 가능성이 있다. 그러나 브라우저에 저장된 비밀번호를 바로 암호 입력부분에 넣게 된다면 최소한 키보드 입력에 의한 위험성은 줄일 수 있다. 그러나 여기에서 더 중요한 부분이 있다. 사용자가 기억할 정도의 비밀번호는 두가지 위험성을 동시에 가지고 있을 가능성이 높다. 첫번째는 자주 쓰는 비밀번호가 한두개 정도 심지어 아예 동일한 비밀번호를 사용하고 있다면 다른 웹서비스에서 유출된 비밀번호가 바로 다른 웹서비스에서 사용될 수 있게 된다. 그리고 사용자가 입력을 매번 할 수 있다는 것은 사용자가 기억하고 있다는 것이다. 사용자가 기억할 수 있는 memorable 비밀번호란 어느정도 유추할 수 있는 비밀번호일 가능성이 높다.


그래서 비밀번호는 아예 사용자가 모르는 것이 가장 안전할 수 있다. 문제는 자신의 비밀번호인데 자신이 모르고 기억하지 못한다는 것이 말이 안되는 소리같다. 브라우저가 비밀번호를 저장하고 있듯이 비밀번호만 대신 저장해서 관리해주는 프로그램도 가능하다. 접속하는 웹서비스에 맞는 사용자 이름 / 비밀번호를 저장하고 있다가 필요한 항목에 사용자 이름 / 비밀번호를 대신 입력해주는 것이다. 사용자가 입력할 필요가 없다. 만약 각 웹서비스 별로 비밀번호를 저장할 수 있다면 비밀번호를 기억할 필요도 없고 얼마든지 길게 그리고 복잡하게 비밀번호를 입력해도 괜찮다. 다만 비밀번호를 관리하는 프로그램을 실행시키기 위한 비밀번호는 기억하고 입력해야 할 것이다. 모든 웹서비스의 비밀번호가 모두 다르다면 한 웹서비스에서 유출된 자신의 비밀번호를 걱정할 필요가 없을 것이다. 유출된 비밀번호를 통해 다른 웹서비스에 들어갈 수 없기 때문이다. 좀 더 보안에 신경쓰기 위해서는 2차 인증 2-step verification 을 사용하는 것이다. [ 인터넷 보안 - 나의 계정을 지키자 ]

공용 컴퓨터를 자주 사용하기 보다는 정해진 기기에서만 접속할 수 있다면 좋을 것이다. 자주 개인정보가 입력될 수록 분명 노출될 가능성은 높아지기 때문이다. 공용 컴퓨터는 특히 어떤 악의적인 프로그램이 설치되어 있을지 데이터 전달을 위한 안전한 환경인지 확인할 수 없기 때문이다. 인증을 위한 다양한 방법을 제시하는 것도 좋다. 로그인을 하면 2차인증을 통해서 다시 한번 확인할 수 있지만 등록된 스마트폰에 간단한 메세지를 보내 로그인을 위해 확인하는 방법도 있고 확인 메일을 보내서 메일에 포함된 확인 주소를 통해서 인증해서 들어갈 수 있다. 모든 방법들은 사용자의 편의를 위한 부분도 있지만 만약 비밀번호가 유출되었다고 해도 본인을 인증할 수 있는 다양한 방법으로 본인이 아닌 다른 사람의 접근을 막기 위해서이다. 사실 2차인증도 완벽하게 안전하다고 말할 수 없다. 가장 창조적인 방법으로 이미 유출된 개인 아이디와 비밀번호를 통해서 접근을 하고 SMS 로 2차인증 번호를 보내주는 계정의 통신사 SMS 서버를 해킹해서 중간에 2차인증 번호를 받아서 이를 입력해서 들어간 경우도 있었다. 더 강화된 다양한 기술을 적용하지만 최소한 진짜 사용자가 접근하는 모든 방법을 그대로 수행한다면 들어가는 것을 막을 수는 없을 것이다.

그렇다면 이렇게 애쓰며 남의 계정을 들어가려고 하는 것일까? 그 속사정을 알수는 없지만 무엇인가 이득이 있기 때문에 그렇게 애쓴다고 할 수 있을 것이다. 가장 쉽게 볼 수 있는 경우는 광고용으로 사용하기 위해서 타인의 계정에 들어가는 것이다. 이미 만들어진 계정이고 자신의 신분을 효과적으로 숨길 수 있고 유출된 비밀번호라면 특별히 계정을 만드는 것보다 더 안전하기도 하기 때문이다. 그리고 자신의 계정으로는 쉽게 올리기 힘든 강도높은(?) 광고들도 올리고 계정이 삭제되더라도 괜찮기 때문이다. 그리고 여러개의 계정을 가진다는 것은 그만큼 접속 회수를 늘릴 수 있는 도구로 사용될 수 있다는 것이다. 이해할 수 없지만 좋아요 ♥ 가 많이 달린 개시물에 대해서는 알 수 없는 신뢰를 보인다. 다수가 좋아하는데 무슨 문제있겠어 혹은 다수가 인정하니깐... 과 같은 요소는 우리가 냉정하게 판단하기 보다는 처음부터 편향된 방향으로 생각하기 쉽도록 만들거나 특별히 큰 관심을 가지지 않는 부분도 거의 유일하게 신뢰할 수 있는 것은 다수의 긍정이라는 사실이라고 믿기 때문에 타인의 수많은 계정을 동원해서 좋아요 숫자만 올리는 것으로 광고효과가 좋다고 믿는 이들에게는 다수의 계정을 확보하는 것이 중요할 것이다.


Data is flowy ... Information is ...

우리가 인식하지 못한 상태에서 수많은 데이터를 만들어 내고 있고 그 데이터는 우리의 의도와는 다르게 사용되기도 한다. 그 모든 순간에도 생각해 볼 부분은 바로 데이터는 흐름이라는 점이다. 숫자 혹은 단순한 문자에 불과하다고 생각할 수 있지만 데이터는 흐름이 존재할 때 더 많은 가치를 가질 수 있는 가능성을 가지게 된다. 그래서 많이 사용되는 데이터일 수록 정보에 더 많은 영향을 줄 수 있는 가능성이 높고 그만큼 중요한 데이터가 될 수 있다. 그래서 데이터는 가치판단 뿐만 아니라 옳고 그른 판단을 내릴 수 없다. 숫자 3.141595 가 나쁘다라고 말할 수 없기도 하지만 심지어 '살인'이라고 해도 '가족을 지켜내기 위해서 강도를 살인하다' 라고 한다면 살인 하나만으로 나쁘다고 말할 수 없기 때문이다.

그만큼 데이터란 우리에게 알려주는 정보의 단편 혹은 아직 분석되지 않은 사실의 흐름일 뿐이지 그 데이터가 우리에게 좋다 나쁘다를 말해줄 수 없다. 문제는 데이터를 어떻게 관리하고 어떻게 통제하는가의 문제이다. 유리한 데이터만 보여주고 불리한 데이터는 감춘다고 해도 데이터는 흐름을 가지기 때문에 데이터의 흐름이 끊어진다면 우리는 그 데이터를 신뢰할 수 없게 된다. 큰 범위에서 의도적으로 조작된 데이터는 항상 스스로 잘못된 부분을 알려주기 마련이다. 일부러 감추려는 데이터는 그 흐름이 인위적으로 끊길 수 밖에 없기 때문이다. 이러한 데이터의 특징을 잘 모르고 감추기 위해서 데이터를 조작하거나 숨기는 것은 자신에게 유리한 / 불리한 데이터가 존재한다고 가치판단을 하기 때문이다. 조작된 데이터를 보여줄려고 한다면 차라리 아무것도 공개하지 않는 것이 숨기려는 자들에게는 최선의 선택이라는 것 아니면 모든 것을 그대로 밝히는 것이 가장 좋을 것이다.


그래서 데이터란 숨기고 보여주지 않으려고 하고 데이터의 관리를 통제하려고 하는 것보다 투명하게 공개하는 것이 중요하다. 그런 의미에서 있는 그대로의 데이터와 그 데이터의 흐름을 숨기지 않으려는 것을 투명성 transparency 라고 한다. 2000년대 말 사용자의 개인정보를 관리하는 기업 특히 구글을 중심으로 해서 데이터의 투명성이 중요하다고 강조했다. 구글 투명성 보고서 페이지에 소개된 투명성에 대한 간단한 설명은 다음과 같다.

"정부 및 기업의 정책과 조치가 개인정보 보호, 보안, 정보 이용에 미치는 영향을 보여주는 데이터를 공유합니다." 
"Sharing data that sheds light on how the policies and actions of governments and corporations affect privacy, security, and access to information."

결과적으로 공유 (제공) 하는 것은 데이터이다. 그 데이터의 성격은 정부 및 기업의 정책과 조치가 개인정보, 보안, 정보 이용에 미치는 영향을 보여준다. 간단하게 설명하면 정부가 요구해서 어떤 범죄 의심자의 위치, 지역이나 관심 분야 등과 같은 개인정보를 얼마나 제공했는지 그리고 그 이유는 무엇이였는지 알려주는 것이다. 그리고 어떤 이유에서 개인이 올린 데이터를 삭제했는지 서비스 장애에 의해서 개인이 제대로 데이터를 관리할 수 없는 순간은 없었는지 보고하는 것이다. 다양한 내용들이지만 서비스 전반에 걸친 모든 데이터의 흐름이 어떻게 진행되고 있는지 데이터의 흐름에 영향을 줄 수 있는 모든 상황 / 조건을 공개한다는 것이다. 중요한 점은 데이터의 흐름을 막거나 통제하는 것이 아니라 가급적 데이터가 잘 흐를 수 있도록 하고 그 과정에서 그 흐름을 막거나 바꿔야 하는 경우가 있었다면 그 이유와 결과를 보고하는 것이다. 따라서 투명성이란 개인정보가 어떻게 어디로 흘러갈 수 있는지 확인할 수 있는 중요한 부분이다.

NGO 단체인 국가투명성기구 (Transparency International‎) 는 국가의 청렴도 반대로 부패지수를 발표한다. 부정부패는 사회나 국가에서 인간을 억압하고 고통을 주는 요소라고 생각한다. 정직하게 생각하고 이를 행동하려고 해도 부정부패가 만연해 있다면 제대로 자신의 양심대로 살아가기 어려울 뿐만 아니라 대부분 희생자가 될 것이라는 점이다. 그리고 부정부패의 가장 큰 적은 부정부패의 상황을 제대로 밝히지 않고 숨기기 때문이라고 보았다. 그래서 국가의 투명성은 부정부패의 정도를 알려서 얼마나 많은 비정상이 존재하는지 알리는 것이라고 본다. 웹서비스도 비슷하다. 좋은 웹서비스가 존재하고 사용자들이 잘 사용해 유용하다고 해도 자주 서비스가 중단되거나 소수의 이익만을 위해서 운영되면 안되기 때문이다. 어떤 문제도 발생하지 않는다면 좋겠지만 완벽할 수 없다면 문제가 되는 부분을 공개하는 것이다. 그리고 문제가 되는 부분을 투명하게 사용자들이 알게 된다면 자신이 사용중에 발생한 문제가 자신의 문제인지 서비스의 문제인지 파악할수도 있을 것이다. 투명성이란 모든 이들이 사용하는 서비스 그리고 그 과정에서 발생하는 모든 데이터에 대한 흐름을 파악할 수 있도록 해줘야 한다는 생각이다.


GDPR ...

요즘은 메일함에서 GDPR 에 대한 메일을 쉽게 본다. GDPR 는 General Data Protection Regulation 의 약자로 유럽연합이 유럽전역을 우선 대상으로 적용하는 '일반 개인정보보호 규정'이라 부른다. 그러나 General 을 그대로 해석해 일반이라고 표현하지만 적극적으로 일반이 아닌 '모든' 혹은 '통상' 이라고 부르는 것이 더 정확할 것 같다. 다시 말해 특별한 조건이 붙지 않는다면... 데이터의 관리, 처리에서 발생하는 문제는 누구의 책임인지 그리고 그 역할에 대해서 정의내리고 있다. 물론 유럽연합에 적용되는 규정이기 때문에 타 지역에서 지키지 않아도 되겠지 싶지만 데이터는 흐름이고 그 흐름에는 특별히 국경의 의미가 존재하지 않는다는 점 그리고 전략적으로도 유럽은 상당수의 데이터의 관리 주체라는 점에서 실질적으로 유럽연합의 적용은 전세계의 적용이나 다름없다. 뿐만 아니라 이 규정에서는 우선적으로 '확장된 영토 적용 범위'를 통해서 지리적 구분이 중요한 것이 아니라 데이터의 흐름이 중요하다고 강조하고 있다.


GDPR 에서 제시하는 중요한 개념에는 Controller Processor 가 있다. Controller 는 '정보통제자' 혹은 '정보관리자' 라고 해석하기도 하고 Processor 는 '정보처리자' 혹은 '정보가공자' 라고 해석하기도 한다. 그냥 컨트롤러 / 프로세서 라고 그대로 쓰기도 한다. 한국어 번역의 기본 내용이 없어 그대로 컨트롤러 / 프로세서로 표현한다. 컨트롤러란 개인정보를 포함하여 개인이 만들어내는 데이터의 수집, 관리 그리고 광범위한 범위에서의 삭제까지 포함하는 데이터 / 개인정보를 어떤 방식으로 관리해야 하는지 책임의 범위를 확대했다. 개인 계정의 해킹에 의해서 노출된 개인정보라면 그 책임이 누구에게 있는지 범위를 확대하고 컨트롤러가 다양한 수단을 사용하려고 노력했지만 어쩔 수 없음을 증명하지 못한다면 컨트롤러의 책임이 있다는 점을 강조했다. 프로세서는 개인정보를 분석, 가공하는 과정에서 필요한 원칙과 역할을 제시했다. 그리고 무엇보다 어떤 과정에서 개인정보 유출되었을 때 적절한 통지를 해야한다. 예전에는 투명성을 통해서 데이터의 흐름을 파악할 수 있도록 했다면 GDPR 이후에는 개인정보가 유출되거나 남용되는 순간에 개인이 바로 알 수 있도록 알려야 한다. 그래서 개인정보의 주체는 권리가 확대되어 개인이 필요하다면 자신의 개인정보의 보관 삭제에 대한 적극적인 권리를 행사할 수 있도록 보장한다. 즉, 개인정보를 지우고 싶다면 개인정보를 보관, 관리, 가공하는 주체들이 이를 실행하고 이 결과를 개인에게도 알려야 한다.


이 정도 내용이라면 개인의 권리는 증가하고 기업은 불리해지는 것은 아닐까 생각하지만 중요한 점은 개인이라도 충분히 컨트롤러나 프로세서가 될 수 있다는 점을 생각해야 한다. 만약 내가 인터넷에서 우연히 얻은 개인정보를 통해서 분석을 한다고 해도 그 개인정보의 주체가 요구한다면 아무리 상업적 목적이 아니라도 그 요구를 들어주어야 한다. 심지어 개인 서버를 운영하고 있고 개인이 접속해서 남긴 다양한 개인정보 - IP 주소, 지역 등 - 에 대해서 수집하는 순간 개인도 컨트롤러가 바로 된다. 결국 기업 / 개인을 위한 규정이 아니라 어떠한 데이터를 얻고 처리하고 살아가야 한다면 이 규정에 적용받지 않을 수 없다는 것도 인식해야 한다. 결국 개인정보에 대한 중요성을 강조하게 되면서 수많은 데이터의 흐름에 대해서 민감하게 인식해야 하는 세상이 되었다.


Cannot be too sensitive ...

전세계의 거의 모든 데이터를 감시하고 테러와 같은 위험을 알아내서 미리 막을 수 있다면 자신의 개인정보도 기꺼이 제공할 수 있는지 묻는다면 어떻게 대답할 것인가? 역설적으로 데이터를 통해서 테러를 막을 수 있다는 생각은 실제로 데이터가 얼마나 중요한 것인지 심지어 현실에서의 행동까지도 미리 막을 수 있다는 뜻이고 이는 데이터 그리고 개인정보는 우리가 생각하는 것보다 높은 생명력(?)을 가지고 있다는 뜻이다. 개인정보는 우리의 삶과 연결되기도 하고 나쁜 목적이라면 한사람의 삶까지도 좌우할 수 있는 무서운 정보이다.

실제로 온라인에서만 이야기를 나누던 상대방에게 화가 나서 마음 먹고 상대방의 실제 거주지와 동선을 파악해서 살인을 했다는 이야기부터 앞서 이야기한 것처럼 가족관계나 사람들에게 협박이 될 수 있는 다양한 정보들을 통해서 두려움에 떨게 만들 수 있기 때문에 개인정보는 충분히 생명력을 가지고 있다. 그리고 생명력이란 타인에게 위협이 될수도 있고 실체하는 physical 위험이 될 수 있기 때문에 스타워즈 1편의 제목인 '보이지 않는 위험 The Phantom Menace' 이 될 수 있다. 현실에서도 인간을 가장 두렵게 만드는 것은 당장 눈앞에 있는 공포나 위험일 수 있지만 단순한 정보 그리고 그 정보에서 나오는 가능성이 큰 공포와 두려움을 만든다. 그리고 인간은 그 공포와 두려움을 피하기 위해서 비논리적인 행동도 하게 된다.


그래서 우리의 개인정보들에 대해서 아무리 민감하게 생각해도 지나치지 않는다. 물론 지나친 생각으로 그 자체가 두려움이 되어 공포 안에서 살아가라는 뜻이 아니라 잘 대처하기 위해서 데이터의 본질과 흐름을 파악하고 개인정보가 어떻게 만들어지고 어떻게 노출될 수 있는지 상식처럼 알아 놓는다면 자신도 모르는 본인의 개인정보로 피해를 보기 전에 대처할 가능성이 높아질 것이다.


Who owns privacy ...?

개인정보는 누구의 것인가? 개인이 보관하고 관리하는 개인의 것이지만 프로세서 Processor - 정보가공자가 만들거나 찾아낸 혹은 분석해서 밝혀진 개인정보라면 그 정보는 누구인지 설명하기 어려울 때가 있다. 예를 들어 자신이 올린 위치 정보가 없는 사진들을 통해서 누군가 사진의 배경이나 주변 정보를 통해서 '누가 사는 곳은 어디이다' 라는 개인정보를 알아냈다면 해당 개인정보는 누구의 것인지 생각해야 한다. 즉, 데이터가 수없이 만들어지고 데이터가 가공되는 과정에서 해당되는 개인들도 인식하지 못하는 정보들은 누구의 것이며 만약 분석한 주체와 상관없이 해당 개인정보 당사자의 것이라고 한다면 당사자는 어떻게 자신도 모르지만 만들어진 개인정보가 있는지 그리고 삭제하고 싶다면 어떻게 할 수 있는지 쉽지 않은 문제이다.

그래서 소위 '잊혀질 권리'를 이야기하지만 정작 잊혀질 권리를 주장할 수 있는 개인정보가 어디에 어떻게 저장되어 있는지 본인도 제대로 확인할 수 없고 검색되지 않는 개인정보는 처리할 수 있는 방법이 없다. 그렇기 때문에 개인정보를 관리하고 가공하는 주체를 나누고 각자의 역할과 책임을 설명하고 있는 유럽연합의 GDPR - 일반 개인정보보호규정 은 지키지 못하거나 책임을 다하지 못한 상황에서 과징금이나 개인 피해에 대한 보상 규정도 포함한다. 그러나 실질적인 문제는 자신이 관리하지도 않는 개인정보를 어디에 있는지 알기 어렵다. 예를 들어 환자의 임상 데이터를 모아서 의학 발전에 도움이 되도록 모을 때 환자가 누구인지 알 수 있는 내용을 제거해서 개인정보였던 내용이 임상 데이터가 된다. 즉, 개인정보에서 개인이 누구인지 알 수 없게 하지만 임상에는 도움이 될 수 있는 데이터로 만드는 것이다. 문제는 제대로 제거했는지 확인하지 못한 상태에서 다른 기관에 임상 데이터를 넘기는데 개인정보가 제거되지 않은 상태로 넘어갔을 때 우리에게 넘어온 임상 데이터가 '당신의 개인정보가 포함되었다' 라고 당사자에게 알려준다면 환자의 의료 정보를 수집한 기관에서 제대로 데이터의 관리를 하지 않았다는 것을 동시에 알리게 된다.


데이터는 흐름이기 때문에 그 흐름에서 누구의 책임인지 찾는 것은 의외로 쉬울 수 있지만 그때 누가 어떤 책임을 가지며 어떤 처벌을 받을 수 있는지는 신중하게 생각해야 한다. 개인정보가 포함된 임상 데이터를 받았을 때 신고하면 신고한 기관은 책임을 면할 수 있다고 해도 그 데이터를 전달해준 기관은 자동으로 책임을 지게 되기 때문이다. 그래서 이런 실수를 제거하기 위해서라도 데이터와 개인정보를 구별하고 정의할 수 있는 방법이 필요하다. 앞서 설명한 것처럼 데이터를 통해서 개인정보를 찾아내는 일을 인간보다 기계가 잘 할 수 있다면 반대로 받은 임상 데이터에서 개인정보가 포함되어 있는지 확인하는 방법도 인간보다 기계가 더 잘 할 수 있을 것이다. 기계에게 임상 데이터를 받게 되었을 때 알 수 없는 환자가 누구인지 알아낼 수 있다면 알아낼 때 단서가 되는 데이터를 제거해서 개인정보가 사라진 임상 데이터로 만들면 되기 때문이다.

역설적으로 데이터에서 알아낼 수 있는 수많은 개인정보들도 기계가 잘할 수 있지만 동시에 개인정보를 찾아낼 수 있는 심지어 그 단서까지도 포함해서 개인정보를 잘 처리할 수 있는 역할을 기계가 잘할 수 있다는 점이다. 이를 응용한다면 사람이 검색과 수작업을 통해서 찾아내고 판단해야 하는 개인정보를 기계가 스스로 학습해서 개인정보를 효과적으로 제거할 수 있다. 가장 대표적인 예는 지도 서비스에서 나오는 수많은 차들이나 사람들의 얼굴 그리고 개인정보로 노출 될 수 있는 많은 개인정보들을 자동으로 흐리게 만들어서 알 수 없도록 하는 것이다. 앞서 예를 들었던 환자의 의료 정보들도 의학적 의미를 살릴 수 있는 수준까지 임상 데이터를 살리고 그 외에 불필요한 정보가 무엇인지 인간보다 더 잘 판단해서 제거할 수 있게 된다.


Human, citizen, ... Identity ...

인간에 관한 권리에 대해서 하나의 문장으로 정리하기 시작한지 그렇게 오래되지 않았다. 정말 반세기 전에는 흑인, 백인이 분명히 구별되어 차별받았던 시절이였고 여성의 참정권이 보장된 것도 그리 오래되지 않았다. 자신이 선택할 수 없는 내용으로 차별을 받지 않아야 한다는 소극적인 형태의 차별금지를 떠나서 자신의 신념, 생각과 같이 스스로 선택했던 것이 인류에 해를 줄 목적이 아니라면 그 어떠한 생각조차도 차별의 대상이 될 수 없다고 해도 여전히 차별과 협오의 시대를 살고 있다. 그러나 조금씩 그 의미에 대해서 고민하고 공론화되면서 다양한 분야에서 그런 차별의 요소를 줄이고자 하는 노력들은 분명 인류의 진보라고 믿게 된다.

예전에는 상상하기 힘들었던 동성애의 사랑을 이제는 드라마에서 쉽게 볼 수 있고 (대한민국은 여전히 아니지만...) 그런 삶의 모습도 우리의 주변에서 일어나는 일들이라고 긍정적으로 받아들일 수 있게 되었다. 그래서 현대 사회에서의 인권이란 우리의 상상력이 어떻게 작용하냐에 따라서 그 범위가 달라질 수 있다. 사회의 변화 이제는 기술의 변화로 인간의 삶이 달라지고 그 결과 얻어지는 모습들이 달라지기 때문에 그런 변화에서 만들어지는 다양한 인권의 범위도 확대해야 하는 것이 사실이다. 그러나 종종 기술이 만든 다양한 모습에 법이 따라가지 못하는 경우를 보면 법이나 규제가 가져야 하는 유연성에 대해서 적극적으로 고민해야 할 시점이라고 본다.


인간에 대한 인권만으로 설명하기 힘들어서 국가 사회에서 시민으로 가지는 권리로 시민권을 생각하게 되었듯 기술의 발달로 만들어지는 개인정보와 데이터에 대한 고민을 통해서 인간이 데이터없이 살아갈 수 없는 그리고 그 데이터로 피해를 보고 때로는 이득을 보는 현실 세상에서 개인정보에 대한 범위까지 포함할 수 있는 정체성을 가지는 자아로 설명될 수 있는 어떤 권리 장전이 필요한 시점이라고 느낀다. 많은 경우 진보적인 생각을 가진 이들과 그런 생각이 필요없는 기득권 사이에서의 계급투쟁으로 얻어지고 그 과정에서 많은 희생이 필요했던 것도 사실이지만 분명 필요한 것은 변화하는 모습에 대해서 어떤 모습의 인간이 더 행복할 수 있는 가능성이 높은지 고민하는 과정일 것이다.

그 과정 속에서 기계 혹은 인공지능으로 대변되는 기계 기술이 영화 터미네이터 (1984) 에서 그려지듯 인간을 억압하는 존재가 아니라 인간의 권리와 확대되는 정체성을 보호할 수 있는 장치로 작용할 수 있기를 바란다. 그리고 그런 작업에서 인간보다 기계가 넓은 범위에서 더 잘 할 수 있다면 기계학습을 통해서 개인정보를 어떻게 보호할 수 있을지 고민하는 것도 필요하다고 본다. 그리고 어쩔 수 없이 수많은 데이터 속에서 작업해야 하는 인간에게 그런 개인정보를 보호할 수 있는 도구로 인공지능이 활용된다면 인간의 직업을 빼앗는 인공지능이 아니라 인간이 특별히 고민하지 않고 좀 더 창의적인 내용에 더 투자할 수 있도록 잡일들을 처리해줄 수 있는 조력자로 인공지능이 존재하고 인간의 직업을 차지하는 역할이 아닌 인간의 작업내용을 더 효율적으로 처리할 수 있도록 도와주는 존재가 될 것이라고 본다.

그렇게 인공지능이 인간에게 도움이 될 수 있는 존재가 될 수 있기를 바란다면 우선 데이터와 개인정보로 넘쳐나는 현실에서 신경쓰이는 수많은 데이터 처리와 개인정보 보호의 역할을 충실하게 수행할 수 있는지 그렇게 도와줄 수 있는 기술의 형태는 어떻게 되어야 하는지 생각해야 할 것이다.


데이터와 개인정보의 시대 ─ 인간이란 무엇인가

Thursday, June 13, 2013

계는 참 매력적인 도구이다. 일상 생활에서 여론 조사 뿐만 아니라 다양한 학문에서도 통계는 세상을 이해하는 가장 합리적인 도구로 자리잡고 있다. 예를 들어 유전학의 경우 유전자 결함에 의한 질환의 원인을 찾아내기 위해서 동일 질환 환자 집단과 결함이 없는 집단을 통계적으로 비교하여 어떤 부분에 문제가 있는지 찾아내는 연구 방법은 대표적이다. (comparative analysis of a genetic disorder) 이 경우 개인 vs. 개인 이 아닌 집단 vs. 집단 으로 분석하고 평가하는 이유는 특정 개인만이 가지는 특정 변이 (variants) 를 제거하기 위한 이유도 있지만 통계는 개별이 가지는 공통의 특징을 추출해 일반적 특징을 만들어내는 과정이기 때문이다. 통계의 아름다움은 세상의 복잡한 현상을 내가 이해할 수 있는 언어로 해석해 주는데 있지만 그 아름다움의 이면에는 우리가 생각해 봐야 할 내용도 있다.

어는 생각을 시작하게 하지만 한편으로 생각을 멈추게 한다. 

우리의 사고(thoughts)가 무엇을 통해 시작되는지 정확히 알 수 없지만 사고의 과정과 표현은 결국 언어를 통해 이루어진다는 것은 어느 정도 공감할 수 있다. 그리고 우리가 가지는 사고의 시작은 소위 화두(topic)를 통해 시작된다. 그렇기 때문에 언어가 존재하지 않는다면 사고를 위해서 언어를 개발하거나, 사고의 범위는 의사 소통의 범위에서 이루어 지지 않을까 하는 상상을 하게 된다. 그러나 다른 한편으로 언어는 우리의 생각을 멈추게도 한다.


예를 들어 누군가 "최선의 선택입니다." 라고 표현하는 순간 인간은 "최선"이 가지는 그 이상적 값어치에 빠져들어 선택은 최선이었다고 생각하게 된다. 물론 최선인지 아닌지 검증하고 판단할 수 있지만 우선 최선이 가지는 그 기대치에 어느 정도 긍정적 판단 위치에 서게 된다. 다른 예로 "착한 소비"라고 이름 지으면 소비가 비록 가치 중립적 행동이라고 해도 착한 소비를 통해 소비의 성격을 착하게 만들어 버리고 우리는 일단 착하다... 라는 언어에 대해서 대체로 호의적인 태도를 가질 것이다. 그러나 이런 단어의 사용은 무엇이 착한지 무엇이 최선인지에 대한 판단보다는 일단 최선이고 착하다 라고 생각하라고 하는 더 이상의 가치 판단을 방해하는 요소가 된다. 즉, 명확한 성격 규정이지만 이처럼 모호한 표현이 없는 것이다.

'좋은', '최선', '많은', '적당' ... 등 의 표현들이 가지는 이런 모호성 때문에 학술 논문이나 대외적 보고서에는 이와 같은 표현을 사용하지 않는 것이 하나의 암묵적 원칙이다. 예를 들어 학술 논문에 '최선의 결과는...', '많은(다양한) 방법으로...', '적당량의 표본을 조사하여...' 와 같이 some, a lot, several, best 등과 같은 표현은 검색해서 모조리 지우는 것이 좋은 논문을 위한 효과적인 방법이다. 그 대신 정확한 숫자와 명확한 범위를 제시하는 것이 가장 기본이 된다.

관적 신뢰 vs. 관적 신뢰 

모든 과학은 모호함을 제거하고 명확한 원리를 찾아내는 것이 하나의 임무 (mission) 같지만 통계는 오히려 그 반대의 성격같다. 수많은 데이터와 분석을 통해서 단순한 결론과 함께 자신이 연구 주제로 세운 가설이 '믿을 만 하다' 와 같은 가장 과학적인 모호함을 표현으로 결론을 내린다. 사실 인간은 복잡한 것을 좋아하지 않는다. 복잡해 보이는 수많은 집단의 원 데이터 (raw data)를 뿌려놓고 인간이 판단하기도 분석하기도 힘든 정보를 보여주면 대부분 거기에서 가치있는 원리를 찾아내기란 불가능이다. "나는 당신을 82.53% 좋아합니다" 라는 표현보다는 "나는 당신을 많이 좋아합니다." 와 같이 좋아한다는 표현이 강조되기를 바랄 뿐이지 82.53%란 수치를 보여주어 좋아하는지 아닌지에 대한 모호함은 더 증가하게 된다. 역설적으로 모호한 표현을 제거하기 위해서 그리고 객관적 신뢰를 주기 위해 도입되는 통계는 실제 우리가 사고하고 생활하는데 오히려 더 큰 모호함을 줄 수 있다는 것이다.


개인적으로 통계의 이런 속성을 객관적 신뢰와 함께 주관적 (인간적) 신뢰 라는 표현을 통해서 설명하고 싶다. 즉, 우리는 수치를 통해 객관성을 유지하고 모호함을 제거한다고 하지만 반대로 우리가 그 수치를 통해 어떤 선택, 판단을 해야 하는지는 더 복잡하게 만든다. 결국 객관적 신뢰는 증가할 수 있지만 그 통계의 결과가 나의 개인적 선택에 영향을 준다면 그 모호함은 더 증가할 것이다.

계는 나에게 무엇을 이야기 해주는가?

이런 심리적 편안함과 과학적 객관성을 잘 균형 잡는 학문을 통계라고 생각하는 것이 통계의 성격을 잘 설명한다고 본다. 통계는 집단의 대표성을 원하고 개별의 특징이나 형태 행동 등에 관심을 가지기에는 너무 복잡한 상황에서 집단의 대표성을 한마디로 표현해줄 수 있는 값을 바라는 희망의 산물이 되어준다. 예를 들어 특정 질환에 걸리면 약 80%의 환자가 7개월 안에 죽게 된다 란 통계학적 결과를 들었을 때 사람들의 반응은 대부분 그 통계적 수치가 무엇을 의미하는지보다는 그 질환이 얼마나 심각한지에 대한 일종의 정량화 (quantitified) 된 느낌을 가질 수 있다. 그러나 이런 느낌이 그 질환에 직접 걸린 사람에게도 동일하게 느껴질지에 대해서는 한번 심각하게 생각해야 할 것이다.

현대 생물학의 대가인 스티븐 제이 굴드(Stephen Jay Gould, 1941-2002)가 복막에 악성 중피종(mesothelioma) 에 걸렸을 때 의사에게 평균 생존 기간이 8개월이란 얘기를 들었다. 그는 "인간은 중앙값은 메세지가 아니다 - Median isn't the message" 란 말을 통해 통계의 맹점을 이야기하고 스스로도 그 맹점을 증명하였다. (그는 잘 치료 받고 잘 살았다.) 통계는 집단의 대표성을 표현하지만 개별의 문제로 회귀될 때는 전혀 다른 문제가 될 수 있다는 것이다.  또 다른 예로 미국의 사망률이 가장 높은 병원으로 시카고 의대 병원이란 통계가 나왔다고 해서 해당 병원이 치료를 제대로 못하는 병원이라고 판단할지 모르지만 오히려 중증 환자나 말기 환자 (terminal) 들이 많이 찾아오면 자연스럽게 사망률은 증가할 것이다.


이처럼 통계는 개별의 문제로 회귀할 때 뿐만 아니라 집단이 가지는 특수한 상황을 고려하지 않으면 전혀 엉뚱한 혹은 전혀 사실과 다른 가치 판단을 하게 될 수 있다. 화이트헤드 (Alfred. N. Whitehead)단순화 (simplication) 는 논리적인 과정이 아닌 '심리적 과정'이라고 이야기했다. 우리가 어떤 대상의 특징을 통계적으로 처리해 알지 못한다면 대상 집단을 어떻게 다루어야 하는지, 어떻게 대해야 하는지에 대한 사전 정보를 얻지 못하기 때문에 개별적 특징보다 일단 단순화 시킨 통게적 사실을 정보로 받아들이는 것은 지극히 심리적인 과정이다.

그런데 이 단순화 과정은 집단 구성원의 개별성보다는 집단 자체의 통계처리된 값을 의미있는 내용으로 받아들이게 되는 것이다. 어느 정도 이 부분에 대해서 공감할 수 있으나 개인의 문제, 개인의 활동으로 들어가게 되면 이는 쓸모없거나 때로는 방해가 되는 자료가 될 수 있다는 것이다. 실생활에서 접할 수 있는 예는 일기예보이다. 강우 확률이 60% 라면 비가 온다는 것일까 아니면 오지 않는다는 것일까? 50%를 넘긴다면 비가 온다고 봐야 하는 것인가? 만약 강우 확률이 50%라면 어떻게 해석해야 하는가. 강우 확률이 어떻게 되든, 나에게 정말 중요한 것은 내가 우산을 챙겨야 하는가 말아야 하는가의 실질적 문제이다.


[ 안젤리나 졸리의 의학적 선택 ] 처럼 자신이 유전자 검사를 통해 위험 요소가 되는 유전자를 가지고 있다면 (혹은 가지고 있지 않다면) 해당 질환에 걸릴 확률이 70% 라는 의미는 어떻게 받아들여야 하는 것인가? 70% 의 확률을 줄이기 위해 예방적 치료를 받는다고 하면 걸릴 확률이 0%가 될 수 있는가? 결국 통계가 제시하는 숫자는 우리에게 심리적 안정감 혹은 불안감을 만든다. 여기에서 많은 학자들은 고민에 빠지게 되었다. 내가 속한 집단의 통계적 숫자가 나에게 얼만큼 영향을 가지고 나에게 의미를 가질 수 있는지, 혹은 내가 가치 판단을 해야하는 대상의 경우 어떤 요소들을 모아야 나에게 의미있는 통계가 만들어 질 수 있는가이다.

데이터는 우리에게 무엇을 전해주는가 

요즘 유행처럼 빅 데이터 (big data) 가 많이 나타난다. 그리고 빅 데이터의 특징을 '기존에 처리가 안되던 데이터가 컴퓨터 기술의 발달로 처리되기 시작한...', '비정형 데이터...', '개인 맞춤형 통계 분석...' 등으로 주요 내용을 정리한다. 그리고 그 개념으로 빅 데이터를 어떻게 응용할지에 대해서 고민한다. 빅 데이터가 가장 이슈가 되었던 실질적 계기는 아마도 오바마 대통령의 재선 과정에서 빅 데이터가 유권자들에게 개인 맞춤형 정보를 제공해 주어 승리의 주요 변수였다는 내용인 것 같다. 그러나 근본적으로 기존 통계와 빅 데이터가 다른 점이 무엇인지 그리고 그 개념의 차이가 우리에게 어떤 새로운 가능성을 줄 수 있는지에 대한 논의는 그리 많이 보이지 않는다. 그리고 발 빠른 경영 마케팅의 개념화 (agile conceptual makeup)은 우리에게 필요성보다는 유행을 만들었다. 그러나 빅 데이터를 통해 우리에게 어떤 삶의 변화를 줄 수 있는지에 대한 구체적인 이미지를 제시하지 못하는 것은 왜 빅 데이터가 출연하고 그 출연을 통해 근본적으로 우리에게 어떤 사고의 변화를 줄 수 있는지에 대해서 별로 고민하지 않은 것은 아닌지 생각해보고 싶다.

통계를 떠나 존재를 생각하다. 

통계는 우리에게 상당히 의미있는 값을 제시해준다. 그리고 그 통계 결과를 통해서 관련 의사 결정의 근거가 되어준다. 그러나 앞서 설명한 통계가 개인적 문제로 회귀할 때 (스티브 제이 굴드와 안젤리나 졸리의 경우) 그리고 집단이 가지는 특수한 상황을 고의적으로 제외하거나 혹은 부각시켜 통계를 여론을 만드는 수단으로 악용될 수 있다는 점도 인정해야 한다. 이런 한계점을 가지고 생각해봐야 할 문제가 있다. 바로 존재론에 대한 사유(speculation)이다.

인간은 하나의 존재로 인식된다. 본인을 생각하자. '나'라는 존재를 생각하면 하나의 단일체로 보이지만 유물론(materalism) 관점에서 바라보면 (생)화학적 구성으로 각종 단백질, 지방 등 다양한 구성 물질로 이루어진 존재이고 더 세분화 해서 들어가면 원자, 아원자 등과 같은 소립자로 이루어져 있다. 나를 구성하는 구성 요소가 원자핵이라고 해서 원자핵 (중성자, 양성자) 의 물리학적 특징이 나를 설명하는 특징이 될 수 없다. 그렇다면 어느 순간부터 어떤 구성 단계까지 올라가면 나라는 존재를 설명할 수 있는 구성이 될 것인가? 원자핵과 전자는 분명 나를 구성하는 물질적 구성이지만 나를 설명하기에는 충분하지 않기 때문에 단백질, 지방 정도의 물질 단계로 설명을 한다면 나를 설명할 수 있는 것인가? 그리고 나를 구성하는 요소이지만 생략해도 나를 설명하는데 충분한 요소는 없는 것인가? 예를 들어 내 몸에는 있지만 꼭 필요하지 않는 대장의 배설물이나 방광의 소변, 그리고 원하지 않게 들어온 중금속 등은 생략해도 나를 설명할 수 있는가?


나를 구성하고 있는 요소들이지만 나란 존재를 설명하는데 필요한 요소와 필요하지 않은 요소를 구별하고 나를 설명하는데 필요한 '최소한의 구성 요소 (minimum span of sets ; ms3) 를 찾는 것은 중요한 작업이 될 수 있다는 문제 인식을 한다면 빅 데이터가 가지는 필요성을 어느 정도 느낄 수 있다고 생각한다. 즉, 빅 데이터는 데이터의 크기가 크거나 기존의 데이터 처리 방식으로 저장되기 어려웠던 데이터를 이제는 처리할 수 있다는 기술의 발전이 아니라 통계가 가지는 한계점 - 개별 개체로 회귀할 때 문제점 - 을 극복하기 위해서 개별에게도 의미있는 통계의 형태와 구조를 찾았고 그 과정에서 우리가 기존에 다루던 데이터의 범위 뿐만 아니라 확장된 범위의 데이터도 다루어야 할 필요성을 느꼈던 것이다. 그렇기 때문에 빅 데이터란 단순히 통계의 기법이나 개인화 방법을 개발하는 것이 아니라 개별에게 의미있는 통계가 되기 위해 어떤 데이터 집단 (data set)이 필요한가를 위한 방법론적 접근이 필요하다.

개별에게 의미있는 데이터 집단을 찾기 위해서는 개별이 가지는 존재론적 범위와 정의가 필요하다. 앞서 설명한 것처럼 나를 설명하기 위해 원자 수준의 설명이 필요하지 않다면 그 수준의 데이터 집단은 의미를 제거하고 나를 설명하기 위한 생화학 물질 수준 정도의 데이터 집단을 찾는다면 그 수준의 데이터 집단을 모아서 나를 설명하는 것이 필요하다. 즉, 내가 설정할 목표 존재를 생각해 볼 필요가 있다. 실질적 예를 들어 만약 맞춤형 의학 (personalized medicine)을 구현하기 위한 존재를 개인이라고 설정을 한다면 개인이 가지는 질환을 평가하고 설명하기 위해서 어떤 단계의 데이터 집단이 필요한지 고려하는 것은 상당히 중요하다. 즉, DNA 수준의 인간 게놈 수준이 한 개별 인간을 설명할 수 있는 수준의 데이터 집단이라고 생각한다면 그 수준에 맞는 데이터 수집이 이루어져 야하고, 만약 생리학적 대사 물질이 실제 개별 인간을 설명하는데 충분하다면 대사 물질 수준의 데이터 수집을 해야하는 것이다.

데이터의 새로운 패러다임을 생각하다.

워낙 많은 사람들이 빅 데이터에 대한 연구를 하기 때문에 구체적 내용을 설명할 필요는 없을 것이다. 개인적인 의견으로 대한민국에서 가장 빠르게 그리고 효과적으로 빅 데이터를 적용할 수 있는 분야는 '복지 분야'가 아닐까 생각한다. 각자의 형편, 상황, 그리고 다양한 외부적 변수가 많이 존재하는 상황에서 각 개인에게 필요한 복지의 양을 계산한다는 것은 기존 통계 기법으로는 거의 불가능하다. 그렇기 때문에 정부는 기존 통계가 가지는 값을 통해서 일반적 기준에 맞추어 국민의 복지 정책을 수립한다. 이는 국민이란 존재가 국가 안에서 복지 수혜자로 어떤 존재인지에 대한 정의가 명확하지 않기 때문이다. 즉, 한 개인이 국가로 부터 받는 복지 혜택, 개인이 국가에 내는 세금 등의 요소를 통해서 이 사람이 존재하기 위해 필요한 복지 혜택이 무엇인지를 평가할 수 없게 된다.

이 때문에 실제로 부자인데 세금을 통해서 복지 수혜를 받는 경우도 존재한다. 호화로운 생활을 하지만 평가할 수 있는 재산이 없는 경우를 생각할 수 있다. 반대로 정말 생활을 위해 복지 수혜를 받아야 하는데 예상하지 못한 재산이나 의도하지 않는 기준에 부합되지 못해 해당자가 안되는 경우도 볼 수 있다. 이런 문제점은 개별의 복지 수준을 설명할 수 있는 충분한 데이터 집단이 정의되지 않았기 때문이다. 따라서 기존의 통계는 이런 개별의 어려움이나 불평등을 쉽게 찾아내기 보다는 이런 맹점을 통해서 불필요한 사회 불균형만 더욱 가중시킬 수 있는 도구가 될 수도 있는 것이다.


복지 국가를 지향하면서 우리는 복지 국가에 존재하는 국민은 어떤 사람이다 라고 제대로 정의내리는 것을 별로 보지 못했다. 결국 복지 혜택으로 국민들에게 돌아가는 총량의 자본과 혜택의 내용만이 하나의 국가 흥보의 차원에서 보여지고 실제로 한 개별 국민이 살아가는데 필요한 최소한의 복지적 요소가 무엇인지에 대한 심각한 고민을 얼마나 했는지 묻고 싶다. 오바마 대통령이 빅 데이터를 통해 선거에 이겼다는 내용을 통해 우리는 대부분 '성공을 위한 도구'로 관심을 가지고 바라본다. 그래서 빅 데이터가 어떤 의미를 가질 수 있고 어떤 가치를 만들어 낼 수 있는지 보다는, 오바마 캠프에서 유권자의 표를 얻어 내듯이 어떻게 소비자의 자본을 모을 수 있는지에 더 큰 관심을 보인다. 그래서 빅 데이터를 설명하는 세미나는 대부분 그 가치보다는 어떻게 이윤을 창출할 수 있다는 기능적 설명을 벗어나지 못하는 것은 아닌지 의문이다.

문은 인간을 향하기 때문에 아름답다

항상 연구 주제를 토론하는 친구들과 빅 데이터에 대한 이야기를 하면서 공감대를 형성한 부분은 바로 빅 데이터는 데이터를 어떻게 처리하는가의 문제가 아니라 이제 데이터 중심에서 존재론 중심으로 (data to ontology) 의 패러다임이 변화하는 시작을 알리는 신호탄이란 부분이었다. 그리고 유전학과 유전학을 데이터로 처리하는 과정에서 인간이 정말 A T G C 로 설명될 수 있는 존재인가. 즉, 4가지 코드를 통해 인간을 모두 설명할 수 있는 최소의 데이터 집단인가에 대한 의문을 시작했다. 그리고 그 의문의 시작은 인간의 존재를 설명할 수 있는, 더 구체적으로 나를 설명할 수 있는 최소의 데이터 집단은 무엇인지 그리고 그 최소의 데이터 집단을 어떻게 표현하고 구체화 시킬 수 있는가? 이 문제를 풀기 위한 평생의 과제라는 것을 느끼게 된다.


이제 학문의 패러다임은 학문 자체가 가지는 이윤적 배경을 벗어나 인간의 존재를 설명하기 위한 다양한 해석적 도구를 제시하는 방향으로 바뀌어 간다고 생각한다. 빅 데이터를 이용한 복지 모델도 그런 하나의 작은 출발이 될 수 있다고 생각한다. 괜찮은 외국의 복지 모델을 찾는 것이 아니라 대한민국에서 살아가는 한 국민이 복지 국가의 일원이다 라는 명제가 참이기 위해 필요한 요소가 무엇인지 찾아내는 작업은 장기적으로 그리고 창조적으로 해야 한다.

통계를 통해 성장하고 통계가 기본인 유전학을 공부하면서 느끼는 가장 큰 의문은 정말 우리는 통계 안에서 의미가 있는 존재인가? 라는 질문이다. 내가 유전적으로 특정 질환에 취약하다는 확률적 결정론은 있는 그대로의 존재보다는 가능성이 만드는 전혀 새로운 존재로 두려워하며 살아갈 수 밖에 없다는 것이다. 통계는 세상을 바라보는 충분히 좋은 도구가 될 수 있지만 개별의 구성을 쉽게 판단할 수 있는 편견의 도구가 될 수 있다는 것도 기억해야 할 것이다.

통계로 바라보는 시선 ─ 빅데이터의 패러다임

Wednesday, May 22, 2013

대 사회는 미디어의 홍수에서 살고 있다. 일반적 방송 미디어 뿐만 아니라 이제는 인터넷을 기반으로 하는 미디어 뿐만 아니라 손쉽게 개인도 미디어가 되어서 하나의 매체가 될 수 있는 시대가 되었다. 다른 시각으로 보면 미디어 분야의 진입 장벽이 낮아졌다고 볼 수 있다. 예를 들어 방송을 위해서도 간단하게 스마트폰과 인터넷만 할 수 있다면 간단하게 팟캐스트 (Podcast) 를 만들어 올려 자신의 생각과 의견을 표현할 수 있고 또한 이를 통해서 자신의 영향력을 확장할 수 있는 효과적인 방법이 되었다. 기술적 발달은 결국 미디어의 형태와 상황을 바꾸어 놓았고 이제 인터넷 미디어의 영향을 무시하지 못하게 되었다.


문제는 이렇게 쏟아지는 미디어의 홍수가 인간에게 어떤 영향을 주는지에 대해서 쏟아지는 미디어의 양에 의해 많은 시간 가지고 생각해볼 기회가 별로 없이 바로 소비자가 되었다는 것이다. 사실 우리에게 쏟아지는 미디어는 우리에게 나빠 보이지도 않고 오히려 다양한 미디어를 통해서 다양한 정보를 얻을 수 있는 좋은 정보원 (information source) 가 된다고 믿고 있다. 물론 초기 미디어의 기능은 충분히 그런 믿음을 충족시켜줄 수 있지만 우리의 삶이 점점 미디어의 사슬에 얽히는 동안 어쩌면 미디어가 우리에게 가하는 폭력의 그물 안에서도 우리는 쉽게 빠져 나오지 못하는 모습은 아닌가 싶다.

엇을 미디어라 부를 것인가? 

미디어 (media) 를 정확하게 해석하는 단어는 잘 떠오르지 않는다. 그나마 매체라는 말이 있지만 미디어의 속성을 정확하게 표현하기에는 매체는 너무 가치 중립적인 표현이다. 오히려 미디어라는 초기 방송 진입 장벽이 높았던 시절 소수의 공급자가 다수의 소비자에게 뿌려주던 (broadcasting) 방식의 매스 미디어 (대중 매체)를 먼저 살펴보아야 할 것이다. 매스 미디어 (매스컴) 은 방송과 같이 제작자가 만든 내용물을 대중이 소비하는 형태를 이야기한다. 언론 (press) 은 기능적 영역이 시사와 보도와 같이 우리가 알아야 할 내용들을 모든 사람들이 각자 알아 내기 힘들고 효과적이지도 않기 때문에 이를 대신 해주는 역할을 해주는 미디어의 한 영역이라고 생각한다면 넓은 의미의 미디어로 포함시켜 이야기해도 별 문제는 없을 것이다. 언론의 학문적 정의나 심오한 내용을 고려한다면 적절하지 않은 정의(definition)일 수 있지만 일단 큰 틀에서 언론을 포함한 다양한 형태의 방송을 포함하여 모두 미디어라고 부르고 시작하는 것이 좋을 것 같다.


스 미디어라고 부를 때 앞의 매스 (mass) 는 대중을 뜻하고 수요층의 폭이 넓은 것을 뜻하기 때문에 요즘에 인터넷을 통해 방송되는 언론이나 방송 형태는 정확하게 매스 미디어라 부르기 어려울지 모른다. 그렇기 때문에 매스 (mass-) 를 제거하고 단순히 미디어라고 부르는 것이 인터넷 기술을 바탕으로 하는 미디어의 성격을 더 정확하게 표현하는 것이라 생각한다. 재미있는 문제는 바로 여기에서 시작한다. 심지어 개인들도 쉽게 방송을 만들 수 있는 다양한 환경이 가능한 가장 큰 이유는 바로 인터넷이란 기술과 조금은 더 생각한다면 개인이 쉽게 자신의 방송 내용을 올릴 수 있는 좋은 플랫폼 (기반시설) 을 서비스를 사용할 수 있게 되고, 소비자들도 스마트폰을 비롯한 모바일 기기로 쉽게 접근 할 수 있게 해주었기 때문일 것이다. 그런데 작은 범위로 보면 이런 개인 방송은 적절한 플랫폼이 제공되지 않았던 오래전부터 그 욕망을 다른 형태로 표현하고 지금도 활발히 이루어지고 있다는 사실을 알 수 있다. 바로 인터넷 사용자들은 자신의 관심사 등에 따라서 카페나 커뮤니티를 만들고 해당 공간에서 자신의 의견을 활발하게 게시하고 이를 통해 사람들과 대화하고 토론했다는 것을 알고 있다.

점점 미디어의 영역은 단순히 방송이나 언론에 제한할 수 없으며, 이런 인간이 가진 미디어의 욕망을 해소하기 위해 이미 인터넷의 다양한 기술은 커뮤니티나 게시판의 형태로 만들어져 있었고 그런 욕망을 대변하여 등장한 대표적인 서비스가 바로 트위터 (twitter) 일 것이다. 그렇기 때문에 트위터는 서비스 시작부터 개인 미디어(personal media)를 위한 좋은 플랫폼 (platform) 으로 소개했고 페이스북 (facebook)의 경우는 관계를 바탕으로 한 관계형 커뮤니티 (relationship based community) 를 추구했던 것이다. 그렇기 때문에 페이스북은 자신의 글에 대한 주변인들의 반응과 의견을 위한 형태로 발전했지만 트위터는 그런 반응과 의견을 위한 형태보다는 전파 (propagation)확산 (expansion) 에 중심을 두었다는 것을 생각해 볼 필요가 있다.

디어의 기능 - 전파와 확산 

디어는 영어로 media 이다. 이는 medium 의 복수형인데 medium 은 물리학 용어로 매질(媒質)이란 뜻도 포함한다. 매질이란 예를 들어 소리가 확산되기 위해서는 소리가 가지는 주기적인 파형(wave) 압력의 변화를 전달해주는 역할을 하는 물질을 말한다. 즉, 스피커에서 나는 소리가 우리의 귀에 전달되는 것은 스피커가 만들어내는 압력의 차이를 전달하여 우리의 귀의 고막에 전달해주기 때문이다. 이때 전달해주는 물질을 매질이라고 부른다. 소리의 경우 대부분 우리가 경험하는 것은 공기이지만 꼭 공기일 필요는 없다. 수중에서 소리를 들을 수 있는 것은 물이나 액체의 물질도 매질로 작용할 수 있지만 매질의 특성상 공기 중에서 들을 수 있는 소리와 다르게 들리는 것이다.


즉, 우리는 스피커가 만들어내는 소리를 정확하게 듣고 있다고 믿고 있지만 실제로 우리는 공기에 의해 전달되는 소리의 왜곡을 듣고 있다고 생각해도 된다. 즉, 스피커와 내 귀 사이에 존재하는 모든 공기의 상태 (온도, 습도, 구성 물질) 가 완벽하게 동일하지 않다면 중간의 매질의 변화는 실제로 스피커가 만들어 내는 소리를 조금씩은 왜곡시키면서 전달시켜주는 것이다. 그렇지만 이런 부분까지 걱정하면서 살아간다면 아마 정신질환에 걸릴 가능성이 더 높기 때문에 허용할 수  있는 범위의 매질에서 우리는 타협하며 살아가는 것이다. 즉, 매질의 가장 기본적인 역할은 전파(propagation)과 확산(expansion)이지만 이 전파와 확산은 꼭 우리가 원하는 대로 조절하기 쉽지 않고 다양한 매질을 통과할 때 그 전파와 확산은 더욱 더 예상하기 힘들어진다.

디어는 우리에게 무엇인가? 

조금만 물리학 이야기를 한다면, 스피커에서 나오는 소리를 정확하게 듣고 싶을 때 우리가 할 수 있는 방법은 몇가지 없다. 가장 먼저 할 수 있는 것은 스피커에 최대한 가까이 가는 것이다. 그렇게 하여 중간의 매질의 양을 줄여 매질에 의해 왜곡될 가능성을 줄이는 것이다. 두번째는 최대한 매질을 최대한 고르게 조절하여 스피커에서 만든 소리를 왜곡없이 전달 될 수 있도록 만드는 것이다. 즉, 우리가 선택할 수 있는 합리적인 해결 방법은 다음과 같다.

   확률 (매질에 의해 왜곡) 을 낮추기 위해서는 매질의 수를 최소화 & 매질의 양을 최소량 

상은 너무 넓고 사건도 많기 때문에 우리가 모든 세상의 일들을 제대로 듣는다는 것은 거의 불가능에 가깝다. 그렇기 때문에 이를 전문적으로 하는 직업이 생겼으니 바로 그것이 언론이다. 이제는 개인 인터넷의 활발한 활동으로 트위터 등을 통해서 이루어지는 내용들을 포함하여 모두 미디어라고 부른다면 해당 미디어를 사용하는 사용자들 (언론의 기자, 트위터의 트위터 사용자 등) 은 전파와 확산을 바라며 미디어를 사용하는 것이다. 실제 일어난 사건, 사고 등 세상에 알려야 하는 내용, 언론학(jorunalism)이 이야기하는 소위 사실 (fact)가 바로 앞서 예를 들었던 스피커가 만들어 내는 소리라고 생각하면 될 것이다. 그리고 우리가 접하는 말 그대로 미디어는 바로 스피커와 우리의 귀 사이에 놓여 있는 다양한 매질에 해당한다.


소리는 매질이 없으면 스피커에서 아무리 소리를 만들어 내도 우리 귀에 전달되지 않는다. 즉, 우리가 어떤 소식을 듣기 위해서는 미디어가 없으면 알 수가 없는 것이다. 그리고 매질의 특징처럼 전파되고 확산되어 꼭 내 귀가 아니라도 내 주변에 같이 있는 사람들 즉 미디어가 미치는 영향권에 있는 사람들은 스피커가 만들어내는 소리를 들을 수 있다. 그러나 마찬가지로 매질이 만들어내는 왜곡도 우리가 현실에서 부르는 미디어에 의해 다양하게 만들어진다. 그렇기 때문에 아무리 같은 공간에 있다고 해도 매질 사이에 방해물이 존재해 매질을 끊어버리거나 아니면 매질 사이에 새로운 스피커를 만들어서 새로운 소리를 만들어 낸다면 같은 스피커를 통해 듣는 것처럼 보여도 전혀 다른 내용을 전달 받을 수 있는 것은 바로 물리학의 매질이 가지는 특성과 같이 방송 / 언론의 미디어도 왜곡의 요소가 되기 때문이다.

금의 미디어를 바라본다. 

다양한 미디어의 발달은 마치 우리가 다양한 사실을 더 정확하게 얻을 수 있게 될 것이라는 생각을 하게 한다. 즉, 소위 상호조사 (cross check) 를 통해서 다양한 소스를 통해서 들리는 이야기를 들으면 사실에 더 접근할 수 있을 것이라고 믿는 것이다. 일정 부분 맞는 이야기이다. 어떤 하나의 사실 (명제)를 검증하기 위해서 더 단순히 참/거짓을 알아내기 위해서 A라는 경로를 통해서 알아보고 B라는 경로를 통해서 다시 알아보아서 두 사실이 참이라면 참으로 받아들일 수 있을 것이라고 생각한다. 언론의 이야기로 예를 들자면 BBC 에서 보도한 내용이 Independent 지에서도 동일한 내용으로 보도했다면 어느 정도 사실이라고 믿게 될 것이다. 그렇기 때문에 일면 인터넷의 발달은 우리가 어떤 사실에 대해 합리적이고 객관적으로 접근할 수 있게 해주었다고 믿게 되었다.

개인적으로 이런 인터넷의 발달이 객관적 사실에 더욱 더 접근할 수 있는 좋은 도구가 되어줄 것이라고 인터넷 초기 사용자로 상당히 기대를 가졌다. 그러나 결론부터 이야기하자면 인간은 그렇게 똑똑한 동물은 아니라는 점이다. 특히 우리가 얻은 정보의 신뢰(confidence)는 어디서부터 시작하는지에 대해서 생각해볼 필요가 있다. 즉, 내가 어떤 새로운 사실을 미디어를 통해서 알게 되었을 때 얻게 된 사실을 진실로 받아들이는 순간이 언제인지 확인해보면 될 것이다.

1) 직접 확인해본다. : 이 방법은 사실에 접근하는 가장 좋은 방법일 것이다. 그러나 절대 효과적이지 않다. 이런 일을 위해 인간은 별로도 직업을 만들었다. 바로 기자이자 언론인이다. 직접 사실 관계를 확인하여 무엇이 우리가 알아야 할 진실인지 판단하지 않고 최대한 객관적으로 전달해줄 수 있어야 한다. 이는 스피커가 만들어낸 소리를 가까이에서 듣는 것이고 기자의 양심이라는 정직한 매질을 통해서 우리는 사실을 믿게 된다.


2) 다른 방식으로 접근한다. : 앞서 언급한 것처럼 A 언론사에서 얻은 정보라면 B 언론사도 동일한 이야기를 하는지에 대해서 확인한다. 다른 방법으로 신문을 통해 얻은 사실이라면 인터넷에서 직접 검색을 통해서 알아보는 방법을 통해서 상호조사를 해보아 신뢰할 수 있을 것이다.

3) 대중의 의견을 수집한다. : 다수가 항상 옳지는 않지만 최소한 다수의 의견에 따르는 것은 심리적 안정감은 줄 수 있을 것이다. 그런데 대중의 의견이 참고가 아닌 사실에 대한 신뢰의 결정적 이유가 될 정도라면 앞서 1) 과 2)의 방식이 신뢰를 얼마나 주지 못하는 시스템인지 확인해볼 필요가 있다. 예를 들어 어떤 국가가 국가의 정책에 반대하는 내용을 인터넷에서 보지 못하게 하고 (모두 보지 못하게 하는 것은 기술적으로 어렵기 때문에 다수가 보지 못하게 하고... 가 더 정확한 표현일 것이다.) 언론을 포함한 미디어가 정부의 일방적 내용만을 보여준다면 사실상 직접 확인하고 다른 방식으로 접근을 해도 통제된 내용들을 신뢰하게 될 것이다.


많은 방법이 있지만 3)의 내용에 집중해서 이야기를 전개해도 무리는 없을 것 같다. 특히 이 부분에서 있어서 가장 중요한 것은 바로 언론의 신뢰가 중요하다. 언론은 가장 정확한 매질이 되어 최대한 왜곡없이 전달할 수 있어야 하는 존재이다. 그런데 만약 이 언론이 가장 왜곡하고 때로는 어떤 사실에 대해 편파적인 방향을 제시한다면 언론은 ⓐ 신뢰를 바탕으로 거짓을 전달하는 사기치거나 ⓑ 불신에 의해 언론의 근본적 기능조차 수행하지 않는 직무유기가 되는 것이다. 현재 대한민국 언론의 신뢰 정도는 각자의 판단에 따라서 생각할 수 있을 것이다. 내가 주로 1) ~ 3) 사이의 어떤 수준에서 사실에 대한 신뢰를 가지게 되는가 사건에 대한 의견을 가질 때 어떻게 믿는지 보면 알 수 있지 않을까? 참고로 신뢰란 언론이 이야기하는 이야기를 궁극적으로 믿는다는 뜻이 아니다. 예를 들어 언론이 "아기 공룡 둘리 초식 동물로 밝혀지다" 라고 사실을 이야기할 때 언론의 보도만으로 믿는지, 아니면 스스로 뭔가 다른 검색 방법으로 알아보는지, 아니면 그 내용에 대해서 커뮤니티 등을 통해 사람들 (대중) 의 의견에 따라 믿게  되는지에 대해서 한번 생각해보는 것이다. 그렇게 해서 "둘리는 아기도 아니었고 육식 동물이었다" 라는 새로운 명제에 도달하는 순간이 바로 신뢰가 생기는 순간이라 봐야 할 것이다.

론은 조작될 수 없는가?

조작과 날조에 대한 궁금증을 만들게 해주었던 사건이 전직 언론인이자, 청와대 대변인인 인물 때문에 궁금하게 되었다. 조작manipulation 으로 뭔가 존재하는 사건에 의도를 가지고 유리한 방향으로 내용을 바꾸는 것이고 날조fabrication 으로 전혀 존재하지 않는 사건을 있는 것처럼 만드는 것이라는 차이점을 생각하게 했다. 누군가 언론은 조작될 수 있는가? 묻는다면 개인적으로 언론은 조작될 수 없다고 대답하고 싶다. 만약 조작을 하는 주체가 언론이라면 그것은 언론의 이름을 차용한 사기 집단일 가능성이 높다. 그렇기 때문에 언론의 기능을 하지 못한다면 언론이라고 부르지 않는 것이 옳다고 본다.


런데 언론은 장악될 수 없다고 믿는 정치인이 있다. 일면 동의한다. 지금과 같이 인터넷이 발달하여 다양한 미디어가 발달한다면 장악되었다고 말하는 것은 조금 이상하다. 왜냐면 충분히 인터넷은 우리에게 사실에 접근할 수 있는 다양한 미디어를 제공하는 것처럼 보이기 때문이다. 그러나 개인적 생각으로 언론의 장악보다 더 근본적인 문제점은 바로 '여론의 장악'이다. 그래서 언론은 장악될 수 있는가? 라고 묻는다면 점점 가능성은 희박해질 것 같다... 라고 믿고 싶지만 여론은 장악될 수 있다고 본다. 그래서 정치권이나 여권에서 제기하는 언론 장악이 중요한 것이 아니라 여론 장악이 더 문제라는 것을 강조하고 싶다.

인터넷은 과격해질 수 있는가?

이전 블로그에도 소개했지만 [ 정치적 프레임 ]을 소개한 적 있다. 코끼리를 생각하지마! 라고 하는 청중들의 머리 속에는 이미 코끼리가 그려지고 있다는 것이다. 정치적 프레임과 마찬가지로 미디어가 사용하는 프레임도 비슷하다. 사실 언론이 제대로 된 역할만 수행한다면 프레임이라는 패러다임을 사용할 필요가 없을 것이다. 앞서 비유한 소위 '정직한 매질'이 된다면 사실의 객관적 전달자로 충분히 그 기능을 수행하기 때문이다. 그러나 현실은 전혀 그렇지 않고 대부분의 언론은 자본의 논리에 언론 주주를 보호하거나 추앙해야 하는 불편한 언론이 될 수 밖에 없다. 물론 이 부분까지 부정할 이유는 없을 것이다. 최소한 이런 언론의 행태는 친한 사람에 대한 인간적 연민이라고 생각하고 넘어갈 수도 있을 것이다.

제는 언론이 적극적으로 미디어 프레임을 통해서 사람들의 생각을 편향시킬 수 있다면 여론은 유리한 방향으로 만들 수 있다는 것이다. 유리한 내용만을 골라 내어 보도하거나, 불리한 내용에 대해서는 인간적 연민에 호소하다 유리한 내용은 사법적 정의, 공정 사회 등과 같은 표현을 사용하여 사람들이 느껴야 하는 감정과 내용을 전달하는 방법이다. 즉, 언론이 특정 사실에 대해서 대중이 어떻게 신뢰하기를 바라는가에 따라서 내용의 강약을 조절하는 것은 그리 어려운 일이 아니다.


같은 사실에 대해서 A 언론은 유리하게 보도하고 B 언론은 불리하게 보도한다면 대중의 자연스러운 반응은 혼란이다. 그리고 자연스럽게 언론에 신뢰할 수 없는 대중은 다른 방법으로 검색하거나 다른 대중의 반응과 의견을 찾아보게 된다. 즉, 언론이 사실 보도에 대한 객관성을 잃어버리고 편파적 사실을 이야기하면 그 순간 언론은 스스로 신뢰를 잃어버리는 것이다. 때로는 정치적 성향에 따라서 어떤 언론의 내용을 믿을 지에 대해서 선택하는 사람들도 있을 것이다. 즉, A 언론의 내용만 믿게 되는 사람도 생길 수 있다. 그러나 중요한 것은 개인적 신뢰의 지점이 어딘가가 아니라 같은 사실에 대해서 여론은 분열이 되어 있다는 것이다. 각 언론마다 논조가 있고 성향이 있다는 것을 인정하더라도 만약 사실에 대한 분열과 대립으로 서로 상반된 내용을 이야기한다면 크게 두가지 가능성을 생각해볼 수 있다. 첫번째는 ⓐ 언론이 객관적 시각을 잃어버리고 주관적 (사적) 관점에서 사실인 듯 이야기하거나 ⓑ 언론이 직접 확인한 사실이 아닌 타 미디어를 통해 재 생산된 이야기일 것이다.

그렇기 때문에 쟁점이 되는 문제에 대해서 차분하게 사실을 알아보기 보다는 대중이 더 신뢰할 것 같은 이야기의 생산에 몰입하는 경우가 많다. 이런 경우 언론은 과격해질 수 밖에 없다. 무엇인가 주목을 더 끌고 싶은 사람은 과격해질 필요가 있다. 얌전한 언론은 대중의 시선을 쉽게 잡기 어렵기 때문이다. 따라서 언론의 기본적 기능을 벗어나 언론이 과격해진다면 그 안에는 쟁점이 존재하고 분열이 존재한다는 것이다. 미디어의 소비자인 우리들은 현명하고 똑똑하기에 그런 과격하고 선정적 보도에 휘둘리지 않을 것 같지만 사실 우리는 미디어의 홍수 안에서 좀 더 자극적 언론에 호감을 떠나 보게 되는 것도 사실이다. 따라서 언론은 이미 과격함을 통해 미디어에도 마케팅이 필요하다는 것을 알게 되었을 것이다. 결국 그렇게 어떤 언론이 더 선정적이고 과격할 수 있는가 경주하여 1등 언론이 주목받게 되는 경마식 저널리즘에 자연스럽게 익숙해질 수 있을 것이다.

열과 분쟁을 통해서 무엇을 얻는가? 

분열과 분쟁을 만들기 위해서는 자극적이고 선정적 내용을 통해서 사람들의 이목을 끌기 시작한다. 그렇기 때문에 근본적 사실보다 자극적 부속에 더 관심을 끌게 한다. 그런데 사람의 호기심을 완전히 충족시키기에는 참 많이 부족한 것이 언론 미디어이다. 언론 미디어는 공공적 성격이기 때문에 사용되는 언어와 표현에 많은 제약이 가해진다. 반면 대중의 좀더 솔찍한 내용을 볼 수 있는 공간이 바로 인터넷 커뮤니티이다. 2013년 대한민국은 모 커뮤니티 사이트때문에 말이 많다. 개인적으로 그 사이트를 들어가보지 않았기 때문에 어떤 의견도 없지만 너무 심한 내용에 대해서는 개인적인 호감을 보이기 어렵다. 그리고 사실 그런 부정적 (negative) 이슈에 의해 매일 반복적으로 이슈화되기 때문에 그 자체도 하나의 대중화가 되어간다는 것을 인식하면 좋겠다.

더 자세히 보자면 앞서 코끼리를 생각하지마! 라고 듣는 순간 코끼리가 머리에 들어오듯이 "XX 사이트는 나쁜 사이트야!" 라고 많이 회자되어도 그 자체가 이슈가 된다는 것이다. 즉, 사람들은 나쁘다에 주목하는 것이 아니라 해당 사이트에 더 관심을 가지게 되고 그렇게 인터넷에서 관심을 끌게 되면 그런 가치 판단을 하지 않았던, 인지하지 않고 있던 사람들에게는 호기심의 대상이 되어버린다는 것이다.

Don't feed the trolls.

터넷에는 이런 표현이 있다. 트롤((인터넷 상에서 분쟁이나 자극적 내용을 생산하는 집단을 트롤이라 부른다.)에게 먹이지 마라. 토마스 그레샴(Thomas Gresham)의 "악화가 양화를 구축한다. (Bad money drives out good.) 은 단순히 악화가 양화보다 힘(power)를 가지기 때문에 자본주의에서 자연스럽게 발생하는 현상을 얘기하는 것이 아니라 정보가 빠르게 전달되는 상황에서 나쁜 소문이 좋은 소문보다 더 빠르게 전달되는 현상과도 연결지어 생각할 수 있다. 즉, 인간은 기본적으로 자신의 위협(threat) 를 최소화하는 방향으로 움직이려 한다. 인터넷의 공간 상에서 정보를 취사하는 사용자들도 마찬가지이다. 다양한 미디어가 발달해서 다양한 언론 내용을 접할 수 있다고 하면 다양한 시선을 바라볼 수 있을 것 같지만 같은 사실에 대해서 한 언론은 공포를 심어주고, 한 언론은 안심을 전달한다면 대부분의 사람들은 공포를 피하기 위해 움직인다는 점이다.


구체적인 과정을 생각해보자. 만약 허리케인이 다가오는데 한 언론은 가능한 피해가 예상되니 충분히 대피할 수 있도록 대비하라고 하고, 다른 언론은 이번 허리케인은 위력적이지 않은 것이라고 보도한다면 대부분의 사람들은 전자의 내용을 더 믿고 싶어 할 것이다. 우리가 어느 시점에서 신뢰하느냐라는 질문을 할 때 우리는 대부분 우리의 생존과 위협에 연결된 내용에 대해서는 보호적이고 나쁜 상황을 대처하기 방향으로 신뢰하려 한다. 그것은 자연스러운 선택이다.

하나의 사실에 대해서 분열과 대립의 의견으로 싸울 때 한쪽은 자극적이고 선정적 내용, 검증되지 않은 의혹에 대해서 일방적으로 보도하면 (소위 흑색선전) 이는 상당히 효과적이다. 왜냐하면 그 의혹들이 사실이 아니라고 해도 이미 미디어 프레임에 잡혀 반대측도 해명을 하기 위해 의혹에 사용되는 단어와 표현을 그대로 사용한다는 것이다. 그렇게 공격적이고 선정적인 편은 항상 대중의 집중을 받게 된다. 그리고 반대쪽은 해명하는데 소진하게 되는 것이다. 즉, "그것은 사실이 아니야!" 라고 이야기할 때 이미 '그것'에 대해서 이야기하고 있는 것이다. 분열과 대립이 강해질 수록 선정적이고 자극적 커뮤니티에 대한 관심은 집중될 수 밖에 없다. 한편으로 XX 커뮤니티는 문제가 심각하다. 라고 말하는 반대쪽도 결국 XX 사이트의 효과적인 전달자가 된다는 사실을 생각한다면 가장 좋은 것은 정말로 아무것도 먹이지 말아야 (Don't feed the trolls) 하는 것이다.

색 엔진에 대해서 고민해보자. 

이전 포스팅에서 소개했지만 우리가 접하는 검색 엔진에 대한 무한한 신뢰를 잠시 접어 둘 필요가 있을 것이다. [ 검색엔진의 진화 - 플랫폼을 통한 인식의 진화 ] 이유는 아주 간단하다. 검색 엔진은 우리의 옳고 그름을 판단해줄 만큼 정확하지도 않고, 우리가 옳고 그름을 판단할 근거를 잘 제공해주지도 않기 때문이다. 지금 우리가 검색 엔진을 통해 검색하는 모습을 한번 생각해보자.

대부분 검색은 키워드를 위주로 이루어진다. 즉, 우리의 관심사를 명사로 판단해서 검색하는 것은 쉽지만 우리의 가치판단을 위해 명제의 형태로 검색한다는 것은 그리 쉽지 않다. 또한 검색의 가장 큰 한계는 언론의 기능이 제대로 작동하지 않는다면 언론이 제공하는 그 사실자체가 믿을 수 없기 때문에 검색 엔진 조차도 신뢰하기가 어려울 때가 많다. 하루에도 몇천개의 글이 올라오는 인터넷 커뮤니티의 자유 게시판을 보고 있으면 재미있는 현상을 많이 보게 된다. 어떤 특정 이슈에 대해서 불타오르 듯 의견이 난무하는 순간 대부분 주장의 근거는 언론사의 기사를 중심으로 이루어진다. 그러나 언론사들도 사실에 대해 너무도 다양한 의견을 제시하여 언론사에 따른 신뢰도를 사용자들이 표현한다. 예를 들어 "A 신문사는 믿을 것이 못된다." 그러다가 같은 사용자가 다른 사건에 대해서 A 언론사의 기사를 인용하며 자신의 생각을 주장한다. 즉, 언론사를 신뢰하여 주장하기 보다는 마침 자신의 주장에 맞는 기사가 있어 자신의 주장을 신뢰할 수 있도록 해당 기사를 인용하는 것이다. 그리고 다양한 개인적 의견과 다양한 분석이 등장한다.


중하고 싶은 현상은 바로 다양한 커뮤니티의 등장은 얼마나 많은 사람들이 언론에 대한 신뢰를 가지지 못하는가에 대한 반증이다. 특히 정치적 이슈가 등장할 때 사람들의 반응과 의견은 사용자에 따라서 뿐만 아니라 해당 사이트의 성격에 따라서도 극명하게 달라진다는 것이다. 그런데 그 많은 사람들이 어떤 근거에 따라 자신의 주장을 만들었지에 대해서 생각하면 대부분이 미디어에 의한 것이라는 것을 알 수 있다. 소위 돌고 도는 미디어의 재생산 속에서 사실이 무엇인가가 중요한 것이 아니라 얼마나 미디어에 의해 많이 돌았던 내용인가가 더 신뢰를 주는 요소가 되었다. 구체적으로 트위터에서 많이 RT (retweet) 된 내용이 사실에 가깝다고 이야기할 수 없지만 대중의 흐름에 그렇게 생각하는 것이 나에게 편하겠구나 믿는 경우도 많다는 것이다.

이 부분에서 독수리의 관점 (eagle's view)를 통해 살펴볼 필요가 있다. 우리가 착각하는 두가지는 ① 많은 사람들은 나만큼 옳고 그름을 판단할 이성적 인간이다 ② '내가 이렇게 격분하고 설명하면 많은 사람들은 이해할 것이다' 이다. 그러나 나 중심이 아니라 나와 비슷한 생각을 가진 내 주변의 사람들을 떠나서 하늘 높은 곳에서 독수리가 되어 바라보자. 그럼 세상에는 나의 가치관과 비슷하게 생각하는 사람은 의외로 내 주변에 위치해 가치관이 강화된 영역에 존재하는 것을 깨달아야 한다. 대부분의 사람들은 내가 분개하고 화내는 사건에 대해서 전혀 모르거나 판단하지 않는 사람들도 많다는 점이다. 즉, 무관심했거나 가치중립적인 많은 사람들에게는 내가 화내며 올린 RT 나 공유가 검색엔진에 이슈를 더 강화시키는 역활을 하여 그들의 호기심을 먼저 자극할 가능성이 높다는 것이다.


결론적으로 가치 판단을 해주지 않는 (해줄 수도 없는) 검색 엔진에 내가 올린 반박글은 가치 판단을 하지 않은 사람들이 오히려 나와 다른 가치관에 관심을 가질 수 있는 계기를 더 마련할 수 있다. 그렇기 때문에 자극적 내용이 더 관심이 끌리고 검색 엔진을 통해 정보를 알아볼 때 키워드로 제한되는 상황에서 우리는 더 많은 트롤을 만들어 낼 수 있다는 것이다.

무리하며... 

설적으로 언론은 스스로의 기능을 제대로 수행하지 못해 신뢰를 얻지 못하게 되어 사람들이 떠나게 되면 더욱 더 다양한 형태의 미디어가 발달하게 된다. 그만큼 정론으로 신뢰를 줄 수 있는 언론이 존재하지 않기 때문이다. 물론 제대로 된 언론이 있다고 해도 미디어는 다양할 것이고 현재와 같이 트위터도 그대로 그 기능을 수행할 것이다. 그러나 언론의 기능이 제대로 되지 않을 수록 분열과 분쟁이 가득한 미디어의 다각, 다색화의 정도가 심해질 것이다. 사회적 문제가 많아도 문제를 제대로 바라보는 시선이 다수의 여론이라면 문제의 해결 의지는 강하고 그에 따라 최대한 한 방향으로 해결하려 할 것이다. 그러나 사소한 문제마다 분열이 만들어진 언론 / 미디어 생태계에서는 결국 그레샴의 법칙처럼 자극적이고 선동적인 내용을 뿌리는 트롤들이 기승을 부리게 될 것이다.


그 상황을 비판하는 것조차 인터넷 생태계 특히, 가치 판단을 하지 않는 중립적 검색 엔진의 환경에서는 무관심했던 대중들에게는 호기심의 대상이 될 수 있고 자극적이고 선동적인 내용들은 가치관이 정립되지 않아 문제 의식이 존재하지 않는 사람들, 특히 청소년 및 청년들에게는 상당히 매력적인 내용으로 다가올 가능성이 있다는 것이다. 반박하는 것조차 인터넷 생태계에서는 관심으로 보일 수 밖에 없다는 것을 생각한다면 개인 미디어의 주최로 개별 사용자들은 항상 수동적 재생산자가 아니라 적극적 감시자이며 때로는 사실의 전달자로 좋은 매질이 되어줄 필요가 있지 않을까.

당히 어려운 문제이다. 무시하고 대답할 가치가 없는 대상에는 철저하게 무관심하고 싶지만 마음처럼 쉽지 않고 나 하나가 그런다고 해도 대중의 심리는 그렇지 않기 때문에 어느새 미디어의 성격도 거칠어지고 선동적인 방향으로 흘러갈 위험이 많은 공간이다. 부작용이 발생하지 않는, 미디어의 표현 자유를 보호하면서도 거칠어지는 미디어를 막을 수 있는 묘책을 제시하지 못하고 그냥 현상적 분석으로 마무리하는 것에 아쉬움은 남지만, 수많은 사람들의 인식의 변화가 없다면 어려운 일이라는 점이기에 이 부분에 대한 미완의 숙제를 남긴 체 글을 마무리해야 할 것 같다. 때로는 우리가 옳은 것을 주장하기 위해서 잘못된 것을 언급해야 하는 그 역설적 광고에 희생양이 될 수밖에 없지만 만약 사회의 분위기가 문제 해결을 위해 분열과 대립을 대신해 토론과 타협의 코드를 사용한다면 인터넷 트롤도 많이 사라질 것 같다.


2012년 대선을 앞두고 12월 18일 윤여준 vs. 김종인 토론 내용을 들으며 잠시 미디어의 생산적 역할을 희망했던 기억을 추억한다.

거칠어 지는 언론 - 미디어의 그레샴 법칙

Sunday, April 14, 2013

젠가 제주 4.3 사건을 배경으로 그린 영화 지슬의 오멸 감독님의 이야기가 오랫동안 기억에 남았다. 라디오 방송에 나와서 했던 짧은 이야기 중에 우리들이 무심코 지나치며 호기심에 바라보는 제주도 올레길에 있는 어떤 집을 볼때 잠시 찾아온 사람들에게는 그저 호기심에 한번 살펴보고 가는 것이지만 그 집에 사는 사람들에게는 자신의 삶이 노출되는 것이고 그런 호기심을 가진 사람들이 100명이라면 100번 자신의 사생활이 노출되는 것이라는 이야기였다. 


획기적인 아이디어로 주거 문화의 새로운 시선을 선사해주었던 '땅콩집' 도 비슷한 운명이었다. 많은 사람들이 호기심과 관심으로 찾아왔고 땅콩집을 소개한 건축가의 부인은 대중에 알려지기 시작하면서 사생활의 힘든 부분도 있다고 남편에게 하소연하기도 했다는 것이었다. 

통제 가능한 시선에 대해서... 

호기심과 관심으로 무엇인가를 살펴보는 것은 나쁜 것이 아닐 것이다. 그런데 의도하지 않게 우리는 개인의 작은 시선 하나하나가 모여서 누군가에는 상당히 부담스러운 양의 시선이 될 수 있다는 점을 직접 경험하기 전에는 알지 못한다. 보통의 삶에서 누군가 나에게 관심의 시선을 준다는 것은 그리 흔한 일이 아니다. 만약 인간이 타인의 시선에서 자유로운 존재이기에 타인의 관심에 대해서 신경쓰지 않는 구조의 의식을 가지고 있다고 한다면, 그또한 상당한 재앙이 되었을 것이다. 모두 화장하지 않은 피부와 제대로 입지 않고 아마도 패션이란 존재하지 않았을지 모른다. 세상의 다양한 패션과 유행 그리고 같은 기능을 하지만 다양한 디자인을 가진 제품들이 쏟아져 나온다는 것이 우리는 의식적이든, 무의식적이든 상당 부분 많은 시선들에 민감하다는 증거가 될 것이다. 

런데 우리가 가질 수 있고 통제 가능한 시선은 우리의 시선 뿐이다. 혹시 누군가 타인의 의식과 행동을 원격으로 조정할 수 있는 능력이 존재한다면 모를까 그렇지 않은 상황에서는 우리는 우리가 가진 유일한 시선만을 통제할 수 있다. 우리가 통제할 수 있는 시선은 우리의 것 하나이기 때문에 우리는 우리의 시선에 온전한 주인이라고 생각할 수 있을지 모른다. 


만약 우리가 올레길에 관광을 온 관광객이나 땅콩집을 지나가는 사람이라고 생각해보자. 우리가 바라보는 시선은 그다지 부담스럽지 않을 것이다. 내가 우연히 올레길에 거주하는 제주도 할머니와 눈이 마주쳤다고 해도, 땅콩집에 사는 사람과 시선이 마주쳤다고 해도 우리는 그리 큰 부담을 느끼지 않을 것이다. 그러나 우리의 시선과 같이 많은 사람들의 시선이 모여 그곳에 사는 당사자들에게는 수많은 시선들을 감당해야한다는 것은 알게 될 것이다. 그렇다고 해서 그냥 모르는 척 지나가야 한다는 당위성이나 그들에게도 개인의 삶이 존재하기 때문에 그것을 보호해줘야 한다는 이야기를 하고 싶은 것은 아니다. 개인적으로 그곳에 있다면 나또한 그곳에 자연스럽게 시선이 머무르게 될 것이다. 이유는 아주 간단하다. 그곳이 유명하다 혹은 우리의 시선을 끌만한 무엇인가 대중적인 요소가 존재한다는 것이다. 바로 우리의 시선은 우연히 머무는 공간의 한 축이 될 수 있지만, 올레길이나 땅콩집과 같이 우리가 가지고 있는 정보에 따라서 시선의 집중도가 변화할 수 밖에 없는 것이다. 

라플라스의 도깨비 

현대 물리학이 많이 연구되고 이제는 소립자 물리학과 우주론도 대규모 실험 장비에 의해서 그 비밀이 하나 하나 풀리고 있는 현대에서도 여전히 흥미로운 주제가 하나가 있다. 바로 '라플라스의 도깨비'라는 개념이다. 라플라스의 도깨비는 현재의 모든 입자들 (질량체) 의 위치를 알고 있고 그 위치에서의 운동량 (운동량이기 때문에 벡터이며 방향을 가진다) 을 알고 있다면 고전 역학의 법칙에 의해서 앞으로의 미래를 결정할 수 있다는 것이다. 그리고 이런 정보와 법칙을 알고 있는 존재가 바로 라플라스의 도깨비이다. 라플라스의 도깨비는 상당히 이상적인 존재로 인식되기도 하지만 사실 인간이 어려운 것은 정보와 법칙을 모두 알지 못하기 때문에 예측이 어려운 것이지 이에 필요한 조건들을 충족시킨 상태라면 예측이 어렵지 않다는 결정론적 입장이다. 

만약 어떤 물체가 지표면으로부터 2m 위 공중에 떠 있는 상태를 목격했다면 (시선) 그 시선의 관심 대상인 물체가 다음에 어디로 향하고 어떻게 될 것인지를 예측하는 것은 어렵지 않을 것이다. 바로 뉴튼의 만유인력의 법칙 더 좁은 표현으로 중력에 의해서 물체는 지표면으로 떨어지게 될 것이다. 이처럼 우리는 현재 물체가 가지는 위치와 해당 물체에 적용가능한 법칙을 알고 있기 때문에 이후의 물체를 예측할 수 있다. 현대 물리학을 적용하지 않아도 이에 대해서 발생할 수 있는 예외성에 대해서도 생각할 수 있을 것이다. 예를 들어 물체는 자성체였고 주변에는 중력보다 강한 자기력장이 존재하고 있었거나 한다면 우리의 일반적인 예상처럼 지표면에 떨어질 것이 아닌 다른 미래가 전개될 것이다. 그러나 결정론적 측면에서도 우리는 물체에 대한 정확한 정보와 그에 따른 생각하지 못한 법칙이 있었을 뿐 그 정보와 법칙이 충분히 고려된다면 이또한 예측할 수 있을 것이라고 이야기할 수 있다. 

주 간단한 예이지만 간단한 상황조차도 우리가 미래를 예측하지 못하는 이유가 정보와 법칙을 모르기 때문인지 (lack of information & principles) 아니면 원래 우리는 미래를 예측할 수 없는 구조의 세상에서 사는 것인지 (structural error of prediction) 인지에 대해서 고민해볼 수는 있을 것이다. 현대 물리학의 영역으로 넘어가자면 미래는 확률론적 미래이고 이러한 미래에 대한 비결정론에 대한 가장 대표적인 예가 바로 슈뢰딩거의 고양이일 것이다. 영화 왓치맨(Watchmen; 2009) 에 나오는 닥터 맨하튼은 모든 정보와 법칙을 알고 있기 때문에 미래를 예측하기도 하고 (고전 물리학의 영역) 광자 이상의 속도로 여행할 수 있기 때문에 미래를 예측하기도 한다. (현대 물리학의 영역) 예측이라는 영역은 인간의 영역은 아니지만 인간은 끊임없이 예측의 정확도를 높이려는 수많은 노력을 하고 있다는 것은 인정해야 할 것이다. 예측의 정확도를 높이기 위해서 가능한 많은 정보들을 얻을려고 하고 그에 관련된 법칙들을 터득하려고 한다. 인간의 행동에 관련된 영역이라면 보통 심리학, 생리학 등의 학문으로 연결될 수 있을 것이고 생명에 관련된 분야라면 생물학이나 의학 등 그 대상에 따라서 우리는 그 법칙을 부르는 방법은 다양하다. 문제는 충분한 정보와 충분한 법칙을 알고 있다면 정말로 미래를 예측하는 것이 가능한 것인가라는 질문이다. 


다른 한편으로 다른 측면의 질문은 얼마나 정보를 모아야 충분한 것이며, 얼마나 많은 법칙을 알아야 충분하다고 할 수 있는가에 대한 문제이다. 아무리 많은 정보를 모을 수 있다고 해도 그 중 내가 관심 가지는 대상의 예측에 관련되지 않은 정보는 결국 정보를 해석하고 분석하는데 쓸데없는 시간만 더 늘릴 것이고 세상에 예외성마저도 포함해서 예측할 수 있는 법칙에 대한 의문은 끊임없이 들게 될 것이다. 이처럼 정보의 다양성 (diversity)와 예외성 (exceptionality) 은 결국 우리가 문제의 복잡성 (complexity) 라고 부르는 요소가 된다. 즉, 어떤 문제를 예측하고자 할때 얼마나 문제를 단순화 시키는가는 생각하지 않아도 되는 요소를 제거하거나 무시해도 되는 다양성을 줄이는 방법이자 예외적 상황에 대한 통제를 가지고 싶어하는 문제 해결방법이 된다. 간단한 예로 지표면 2m 위에 떠있는 물체에 대해서 떨어질 가능성이 높다는 것을 생각하는 것은 해당 물체가 자성을 가진 상황이나 그 자성을 이끌 자기력장에 놓여 있지 않다는 예외성을 줄여 문제를 간단하게 만들려고 하는 노력이다. 

처럼 실제의 현상은 전혀 단순하지 않지만 문제의 해결 혹은 미래의 예측을 위해서 문제를 단순하게 만드는 과정은 실제 존재하는 정보의 엔트로피를 무시하는 과정을 통해서 이루어진다. 엔트로피(entropy)는 열역학 (thermodynamics) 의 관점에서 보았을 때 우리가 사용할 수 없는 에너지의 분산된 형태를 이야기한다. 예를 들어 엔진 안의 연소된 기체는 엔진의 피스톤을 밀어 내어 실제로 우리가 사용 가능한 운동 에너지를 만들어 낼 수 있지만, 아무리 온도가 높다고 해도 핀란드 사우나의 증기열은 기계적 운동 에너지로 변환하기에는 충분한 에너지의 형태가 아니다. 즉, 온도나 압력만으로 우리가 사용가능한 에너지의 형태로 정의할 수 없는데 이때 엔트로피가 낮은 상태에서는 상대적으로 우리가 유용할 수 있는 (utility) 상태도 높기 때문에 에너지가 어떤 식으로 흐를 것인지에 대한 충분한 정보를 가지고 있는 것이다. 즉, 에너지를 사용하는 사용자 입장에서는 예측 가능한 정보의 양과 사용 불가능한 예측할 수 없는 다양성이나 예외성의 모든 형태의 양 (엔트로피)를 합산하면 항상 일정하다는 가정을 해볼 필요가 있다. 

태양 에너지를 생각해보자. 태양 에너지는 에너지 자체만으로 고려하면 상당히 유용한 에너지이다. 그러나 해당 에너지를 우리가 원하는 형태의 에너지인 전기 혹은 열 에너지로 변환시키지 못한다면 아무리 높은 에너지라도 제대로 사용할 수 없는 것이다. 즉, 에너지의 엔트로피는 상당히 낮은 편이다. 앞에서 설명한 개념으로 치환하자면 우리는 태양 에너지라는 명확하고 상당히 뚜렷한 정보를 가지고 있는 것이다. 그리고 이 정보를 이용할 수 있는 법칙도 분명히 존재한다. 즉, 태양 에너지는 에너지의 전달에 있어 복사라는 형태를 취하고 있고 태양 에너지를 전기 에너지 혹은 그 자체의 열에너지로 변환하기 위한 물리 법칙도 상당히 정확하게 알고 있다. 문제는 태양 에너지 자체의 정보는 높은 편으로 상대적으로 엔트로피는 적은 상태이지만 우리가 원하는 형태의 전기 혹은 열 에너지로 변환하는 과정은 엔트로피의 증가를 요구하게 된다. 즉, 전기 에너지로 변환하기 위한 법칙도 알고 있지만 효율적이지 못하거나 예외적인 상황이 많이 발생하기 때문에 흔히 말하는 에너지 변환에 있어 효율이 높지 못한 것이다. 이런 이유로 엔트로피의 법칙 (열역학 제 2법칙)은 열효율에 대한 법칙으로 불린다. 


열역학의 영역은 우리의 일상적인 삶과 별로 상관이 없을 것처럼 보이지만 실제로 그 반대이다. 앞서 설명한 정보 / 엔트로피의 개념을 생각해보자. 우리가 일상에서 내리는 모든 결정들은 자신이 가지고 있는 정보 / 엔트로피의 양에 따라서 결정을 하게 된다는 것이다. 우리가 내리는 아주 사소한 결정, 예를 들어 오늘 점심은 무엇을 먹을 것인가에서부터 시작해서 자신이 가지고 있는 자본을 어디에 투자를 할 것인가와 같은 규모의 모든 결정에는 이러한 정보 / 엔트로피의 개념을 통해서 결정의 과정을 생각할 수 있게 될 것이다. 쉽게 풀어 이야기하면 일반적인 상식으로 우리는 우리가 많은 것을 알고 있는 것이 경쟁력이 될 것이라고 생각한다. 그렇기 때문에 자신의 결정에 관련있는 많은 내용을 알려고 할 것이다. 그러나 그 안에는 내 결정에 중요한 관련이 있는 정보가 있을 수 있지만, 실제로는 이러한 정보와는 반대로 우리의 결정에 더 큰 복잡성을 줄 수 있는 엔트로피의 내용도 존재할 수 있다는 것이다. 정보 / 엔트로피의 개념을 통해서 접근하는 방법은 단순히 정보의 양이 중요하다는 점을 강조하는 것과는 큰 차이를 줄 수 있다. 

만약 엔트로피의 개념을 생각하지 않는다면 의사결정권자는 가능한 많은 정보가 결정에 도움을 줄 것이라고 생각할 것이다. 결정 이후 예측은 실제로 정보의 양에 달려있는 것이 아니라 정보 / 엔트로피의 균형이 어느정도인지에 따라서 내가 가지는 결정에 다양성과 예외성이 최소화할 수 있는가가 더 중요하다는 점이다. 


그렇다면 실제 생활에서 가지는 엔트로피의 내용은 어떤 것들이 존재하는가? 가장 사소해 보이는 오늘 점심을 결정하는 과정에서 발생할 수 있는 엔트로피의 내용에는 음식 맛이 워낙 좋아서 주인이 쉬고 싶은 날 쉬는 음식점이 있다고 한다면 해당 음식점의 엔트로피는 상당히 높은 편이다. 즉, 아무리 맛있는 음식점이라는 정보가 있다고 해도 우리가 통제할 수 없는 내용에 대해서는 항상 엔트로피 내용이 될 수 밖에 없을 것이다. 그렇기 때문에 이러한 엔트로피의 양을 줄이기 위해서 가능한 현명한 대처는 직접 해당 음식점에 전화를 해서 영업하는지를 확인하는 방법이다. 따라서 우리가 통제할 수 없는 요소를 결정권자가 통제를 하기 위해서는 엔트로피의 양을 줄이고 그만큼 정보의 양을 늘리는 방법을 선택하면 될 것이다. 즉, 우리의 결정이 우리가 원하는 방향으로 움직일 수 있게 해주는 것은 정보의 절대량이 중요한 것이 아니라 우리가 정보라고 생각하고 있는 내용 중에서 엔트로피는 얼마나 존재하는가에 대한 평가이다. 따라서 정보를 긁어 모으는 것이 중요한 것이 아니라 오히려 제거해야할 내용(엔트로피)과 꼭 필요한 내용이 무엇인지(정보) 를 확인하는 과정이 더 중요할 것이다. 

시선에 대해 생각하다. 

올레길과 땅콩집을 바라보는 사람들의 시선으로 다시 돌아가 보자. 그리고 바로 앞서 조금은 길게 이야기한 정보 / 엔트로피에 대한 개념을 같이 생각해보자. 우리는 올레길과 땅콩집에 왜 시선을 주는가?  서론에서 언급한 것처럼 우리가 가질 수 있는 시선은 자신의 시선 하나이다. 그렇다면 우리가 가진 하나의 시선이 정말 우리의 통제와 제어에 의해서 우리가 원하는 대로 바라보는가? 다시 표현하자면, 각자의 시선은 각자가 완전히 소유하고 있는 것인가? 조금 다른 표현으로 우리는 정말 바라보고 싶은 것을 제대로 바라볼 수 있는 충분한 능력을 가지고 있는 것인가? 

금은 다른 영역으로 넘어와서, 정보 / 엔트로피 의 개념으로 다시 돌아와 보자. 우리의 결정이 우리가 원하는 방향으로 그나마 제대로 가기를 바란다면 정보의 양이 중요한 것이 아니라 정보와 엔트로피를 구별하여 어떤 것을 제거하고, 어떤 것을 선택해야 하는지에 대한 문제임을 강조했다. 물론 이 결정 과정에 대해서 동의하지 않는다면 정보의 양에 의존하는 방식을 취하고 그 방향에 맞추어 자원 (시간, 돈 & 인력) 을 사용하면 될 것이다. 그러나 정보 / 엔트로피 의 구별에 가장 중요한 역할을 하는 것은 정보를 뒷받침하는 새로운 정보가 되고 그 정보는 또한 정보만큼이나 엔트로피도 포함하게 되고 결국 더 많은 정보를 취하려 하면 할 수록 엔트로피도 증가하기 마련이다. 따라서 우리는 불필요한 과정의 반복을 줄이기 위해서 단순화의 과정을 거치게 된다. 단순화는 내가 다루어야 할 대상이 10 입방미터 (cubic meter) 의 대상이라면, 별로 중요해 보이지 않는 (비록 그 부분이 정보에 해당하는 부분이라 할지라도)  부분에 대해서 과감하게 시선을 돌리는 것이다. 즉, 우리가 관심을 가지는 대상을 축소하거나 집중하여 내가 결정을 내려야 하는 부분을 줄이는 작업이다. 일상적 용어로 문제를 단순화, 간략화한다고 할 수 있지만 공학적인 용어는 이를 시스템화 (systemization) 이라고 부른다. 


시스템의 공학적인 정의는 “우리가 관심을 가지는 대상” 이다. 우리가 결정을 내려야 하는 대상이 아니라 우리가 관심을 가지는 대상이다. 예를 들어 펀드 투자를 한다고 할 때 어떤 포트폴리오 구성에 따라서 A 에 60% 를 투자하고 20% 는 B 에 투자하는 등의 구성을 가졌다면 우리는 A와 B 가 서로 상충되는 이익구조를 가진다고 해도 A 에 집중하게 된다. 따라서 투자자에게는 A는 시스템이지만 B 또한 투자의 대상인 것을 생각하면 쉽게 알 수 있다. 

이처럼 우리의 시선이 어디에  두는가에 따라서 우리가 결정을 하려고 하는 문제의 규모는 줄어들게 되고 그때 내가 관심을 가지는 대상 (시스템) 에 관련된 정보 / 엔트로피 이외는 과감하게 무시하는 것이 결정의 단계에서 가장 효율적인 선택이 될 것이다. 아주 사소한 일상의 과정을 생각하면 의식적이든 무의식적이든 우리의 시선이 우리의 결정에 상당히 중요한 역할을 한다는 것을 느낄 수 있다. 이런 과정은 우리가 왜 충분히 논리적이고 똑똑한 존재에게도 The Greater Fool 이론이 적용되는지 생각해볼 수 있다. 즉, 우리가 충분한 정보를 모르고 있거나, 엔트로피의 내용을 알고 있다고 해도 우리가 관심을 가지는 시스템이 잘못 설정되었기 때문에 (우리의 시선이 엉뚱한 곳에 놓여 있기 때문에) 설명할 수 있을 것이다. 



언론의 기능에 대해서... 

언론의 기능에 대해서 생각하기 위한 본론을 위해서 서론이 이제까지 길어졌다. 정치적 입장에서 언론이 어떻게 대중의 생각을 조정하는지에 대한 이야기는 노암 촘스키의 Manufacturing Consent (1992)를 통해서 살펴보면 좋을 것 같다. 개인적으로 이 책을 읽고 가슴으로는 수긍이 되지만 오히려 머리는 따라가기 힘든 상황에 놓였다. 그러나 언론, 미디어이 가지는 기능에 대해서는 기본적으로 공감을 하고 그 과정을 공학적, (열)역학적 과정과 비교를 해서 기능을 설명하고 싶은 생각이 강했다. 


소설 같이 긴 서론의 내용을 정리하자면, 

  • 사결정 과정은 정보 / 엔트로피 의 균형에 의해서 구성된다. 
  • 보의 양은 늘리고, 엔트로피의 양은 줄이는 것이 원하는 결과를 높은 확률로 이룰 수 있다. 
  • 선은 우리가 관심을 가지는 대상 (시스템)을 정한다. 
  • 사결정은 시스템에 따라서 결정에 영향을 주는 정보 / 엔트로피를 새롭게 구성한다. 

로 요약할 수 있다. 

언론은 시선의 자유도를 감소시킨다. 

언론에서 보여주는 세상은 언론에서 보여주고 싶은 내용으로 이루어질 수 있다. 예를 들어 언론 사주의 이익에 나쁜 영향을 줄 수 있는 내용이 있었다면 이에 대해서 보여주지 않는 것 혹은 이를 미화하여 보여주는 것만으로도 해당 언론을 바라보는 사람들의 시선이 가질 수 있는 자유도를 감소시킬 수 있다는 것이다. 이런 부분까지 언론 통제라고 부를 수 있을지는 모르겠지만 자본에 의해서 움직이는 하나의 기업으로 당연한 부분일 수 있다. 그리고 아무리 특정 세력의 이익을 대변하는 언론이 존재한다고 해도 지금과 같이 다양한 미디어 형태가 존재하는데 언론의 통제가 일부 언론에 의해서 통제가 될 수 있는가에 대한 의문을 가지는 사람들도 많을 것이다. 즉, 소위 SNS 라고 불리우는 다양한 형태의 미디어가 존재하는데 아무리 특정 세력으로 옹호하는 언론의 보도가 있다고 하더라도 이에 반대되는 내용에 대해서 다양한 미디어를 통해서 충분히 들을 수 있는 환경이기 때문에 특정 언론이 언론의 전체 여론을 통제할 수 없다고 생각할 수 있다. 

가장 처음의 서론으로 돌아가보자. 우리가 가질 수 있는 시선의 숫자는 단 한개, 우리의 시선일 뿐이다. 그리고 우리가 어떤 시선을 가질 것인가는 우리가 관심을 가지는 시스템이 중요한 것이지, 전체의 세상이 어떻게 돌아가는지는 별로 중요하지 않을 수 있다. 세상이 어떤 진실에 의해 돌아가는지가 중요한 것이 아니라 우리가 어떤 시선을 통해 어떤 사실을 받아들이는가가 더 중요한 것이다. 그런데 거론되지 않은 사실 혹은 단순히 SNS 를 통해서만 접할 수 있는 사실은 우리가 쉽게 시선을 접할 수 있는 내용이 아닐 수 있다는 점이다. 올레길에 그냥 평범하게 살아가는 제주도 주민과 땅콩집의 주인이 수많은 시선이 신경쓰이는 이유는 바로 시선이 가지는 다양한 시스템이 걱정되기 때문이다. 따라서 사람들에게 보여주는 내용과 보여주고 싶지 않은 개인적 내용을 구별하기 시작하고 그에 따라서 소위 ‘신경쓰이는’ 과정이 되는 것이다. 


그런데 언론은 이러한 시선이 머물 수 있는 대상을 집중시킬 수 있다는 점이다. 관심을 가지기 쉬운 대중적인 대상, 조금은 더 말초적인 내용을 집중시키는 방법 등을 통해서 우리가 시선의 집중이 필요한 대상에서 집중이 필요없어도 되는 대상에 대해서 더욱 시선이 집중되게 한다. 언론은 모든 사실에 대해서 동일한 비중으로 전달하지 않기 때문에 편집권과 편성권을 통해서 어떤 이야기에 어떤 자극을 받을 것인지에 대한 대중적인 작용을 고려할 수 있다는 점이다. 즉, 우리의 시선을 통제할 수는 없지만, 최소한 우리의 시선이 언론이 원하는 대상에 머무를 수 있는 확률은 충분히 높힐 수 있다는 점이다. 

런 작용을 요약하자면, 언론은 시선의 통제는 이루기는 어렵지만, 시선의 자유도를 감소시킬 수 있다는 것이다. 즉, 우리가 관심을 가지는 대상, 시스템이 어떤 대상이 되어야 하는지에 대한 보기를 적게 보여주거나 상대적으로 흥미롭고 짧은 시간에 집중을 가질 수 있는 대상을 동시에 보여주는 것을 통해서 시선의 자유도를 줄일 수 있다는 것이다. 3S (Sports, Sex, Screen) 정책을 통해서 사람들의 시선을 분산시키고 관심을 가지고 분노해야 하는 대상에 둔감하게 하는 과정은 그리 어렵지 않게 생각할 수 있을 것이다. 문제는 어떤 이들의 주장처럼 미디어가 다양화되어 주요 언론이 아무리 시선의 자유도를 줄인다고 해도 인터넷 시대에 대체 언론 혹은 미디어를 통해서 충분히 관심의 대상을 찾을 수 있다고 주장할 수 있다. 계속 반복해서 나오는 올레길과 땅콩집을 다시 생각해보자.  우리의 시선도 결국 기본이 되는 정보가 있어야 알 수 있다. 우리가 어떤 대상에 관심을 가져야 하는지 찾기 어려운 상황에서 시선을 끌 수 있는 자극적 요소들이 다양화 된다면 그런 환경 속에서 의지를 가지고 다양한 시선의 대상을 찾아 나선다는 것도 어렵다. 즉, 올레길과 땅콩집이 집중이 될 수록 시선의 집중이 되면 될수록 그 주변을 통해 찾아볼만한 관심의 대상도 쉽게 지나칠 수 있다. 이유는 아주 간단하다. 인간은 생리학적, 심리학적으로 무한한 관심을 가질 수 없기 때문이다.

인간은 의식적인 행동을 지속하지 못한다. 

우리의 문제 해결과정, 다소 협의적인 범위로 의사결정의 과정에서 가장 중요하게 생각하는 것은 예측의 안정성을 통해서 자신의 결정이 원하는 방향대로 이루어지기를 바란다. 이런 과정을 정확히 정량적으로 계량하기는 어렵지만 정보 / 엔트로피의 개념으로 소개했고 앞서 소개한 것처럼 우리는 정보의 양이 중요한 것이 아니라 우리가 통제하기 어려운 엔트로피의 양을 줄인 상태의 의사 결정을 하기를 원한다는 것을 강조했다. 이를 언론의 기능과 연결해서 생각해보면, 언론이 제공하는 것은 우리에게 정보가 될 수도 있고, 엔트로피가 될 수 있는 내용이다. 그러나 미디어의 가장 큰 장점은 특별한 이유가 없다면 미디어의 공신력(public confidence) 이라는 특징때문에 언론을 엔트로피가 높은 내용으로 인식하기 보다는 상당히 신뢰하는 정보의 영역으로 받아들인다는 점이다. 물론 객관적 보도의 과정에서 언론 관계자들의 개인적인 가치관이 반영될 수 있는 가능성은 있지만 우리는 언론의 내용을 주의깊게 듣지 않고 내용을 정보로 받아들인다면 사실 관계를 판단하고 검증하는 모든 과정을 언론에게 전적으로 신뢰하며 맡긴 결과가 되어버린다. 


러나 여전히 주체적인 인간으로 우리의 행동의 지배자인데 언론의 기능으로 자신의 판단과 상관없는 행동들을 할 수 있는지에 대해서 불쾌함을 느낄 수 있다. 그리고 언론이 아무리 대중의 마음을 움직여 자신들의 원하는 방향으로 이끌 수 있다고 하더라도 적어도 나는 그렇지 않을 것이라고 믿고 싶은 것이 사실이다. 앞서 언급한 the Greater Fool 이론에 대해서 설명이 필요할 것 같다. 의사 결정 과정에서 높은 엔트로피, 다시 말해 위험도가 높고 예측 가능성도 낮아 자신의 의사 결정이 제대로 실행되지도 않거나 혹은 그 반대의 결과를 만들 수 있다고 해도 인간은 상당히 비 이성적인 행동을 할때가 많다. 이런 과정에서 특별히 엔트로피가 높은 내용을 자신의 의사 결정 과정으로 받아들이는 경우는 그리 많지 않다. 문제는 자신의 의사 결정에 이르는 논리적 과정을 통해서 자신이 고려해야하는 시스템을 축소시키거나 혹은 합리적이지 않은 설정으로 자신만의 가상의 시스템을 만든 상태에서 해당 시스템의 호의적인 정보를 수집하고, 불리한 엔트로피는 제외할 수 있는 상상력을 가지고 있다는 점이다. 

주식 투자에서 손해를 보는 많은 투자자들을 생각해보면 손해 이후 어떤 부분이 잘못되었는지에 대한 평가를 요청하면 대부분의 투자자들은 자신이 생각하지 못했던 요인이 발생했고, 자신이 생각했던 시나리오 대로 움직여 주지 않았다는 점을 강조하며 여전히 자신이 생각한 대로 움직였다면 성공할 수 있었다는 점을 강조하는 것을 자주 볼 수 있다. 바로 자신이 생각했던 시나리오는 제대로 된 정보에 근거를 한 내용이 아닌 대부분 상당히 높은 엔트로피를 가지는 내용이지만 그 안에서 발생할 수 있는 예외성과 다양성을 배제하여 상상으로 엔트로피가 상당히 적은 정보로 가공하고 이를 바탕으로 의사결정을 한 것이다. 

제 이루어지는 법칙과 다르게 이처럼 높은 엔트로피의 내용을 정보로 가공하는 이유는 여러가지를 생각할 수 있지만 대표적으로 공포와 욕망 (Fear & Greed) 로 설명하기 편할 것 같다. 정보와 엔트로피를 근거로 의사결정을 하는 과정은 동일하지만 어떤 것이 정보인지, 어떤 것이 엔트로피인지를 구별하여 과정에서 우리의 판단은 생각보다 견고하거나 면밀하지 (rigours) 못하다는 것이다. 바로 이 부분을 언론은 간단하게 이용할 수 있다. 정보 / 엔트로피를 구별하는 과정에서의 문제점은 잘 평가하지 않고 자신이 나름대로 만든 근거에서는 상당히 논리적으로 판단했다고 착각하는 인간이기 때문에 언론은 적절하게 공포와 욕망을 자극시키면 인간으로 가지는 논리적 동물의 자부심을 세워주면서 적절하지 못한 의사결정을 하게 만들 수 있다. 예를 들어 언론 보도를 할 때 인간의 욕망을 자극시키는 방법으로 ‘XX를 투자하는 사람들은 향후 어떤 이익을 기대할 수 있다.’ 와 같이 상당히 높은 엔트로피의 내용 중 가능한 몇가지만 제시하는 방법이나 ‘YY를 대처하지 않으면 심각한 문제가 발생할 수 있다.’ 와 같이 잠재적인 위험에 대해서 언급하여 사람들에게 공포심을 느끼게 할 수 있다. 



어떻게 언론을 바라볼 것인가? 

언론은 이런 방법으로 충분히 공포와 욕망을 자극시킬 수 있다. 그런데 이런 방법이 순수한 언론의 역할에 의해 대중을 걱정해서 하는 보도인지, 혹은 어떤 숨은 의도를 가지고 보도하는 것인지 정확하지 않지만 판단할 수 있는 방법은 정보 / 엔트로피의 개념으로 생각해볼 수 있을 것이다. 만약 순수한 언론의 역할을 다할려고 한다면 정보의 내용을 제공하려고 노력할 것이다. 반대로 어떤 의도를 가지고 있다면 대부분 엔트로피가 높은 내용 중 가능한 일부분 혹은 상당히 제한적인 내용에 대해서만 알려줄 것이다. 

렇게 의식하기 위해서는 우리가 언론을 통해서 얻는 내용이 꼭 정보가 될 것이라는 믿음을 버리는 것이다. 즉, 계속 반복해서 설명한 것처럼 언론은 우리에게 정보만큼 상당량의 엔트로피도 제공하고 있다는 점이다. 우리가 의식하지 않고 언론을 받아들이며 언론에 대해서 맹신을 하게 된다면 우리는 무의식적으로 언론이 의도하는 방향으로 정해진 정보에 의존하며 의사결정을 하게 된다. 그렇다면 어떤 것이 정보이고 어떤 것이 엔트로피인지 어떻게 판단할 수 있을까? 우선 언론에 대한 맹신적 신뢰는 버려야 할 것이다. 언론의 순수한 기능은 상업적 독립이 이루어진 상태에서 언론인들 모두 사명감을 가진 상태에서도 상당히 어렵다. 아무리 이상적인 조건을 제시해도 결국 인간의 과정이기 때문이기 때문이다. 

그렇다면 언론의 내용을 판단할 수 있는 대체 미디어는 존재하는가에 대해서도 생각해봐야 할 것이다. 소위 SNS 나 개인 미디어, 혹은 상업적 자본에 독립한 미디어를 있다면 이런 매체를 통해서 정보 / 엔트로피를 구별할 수 있는 능력을 가질 수 있는지 고민해 봐야 할 것이다. 그러나 개인적인 생각은 이런 방법도 결국 대중화가 된다면 언론과 마찬가지로 엔트로피를 제공하며 정보라고 속이는 현상은 반복되고 오히려 더 큰 문제를 만들 수 있을 것이라고 생각한다. 다시 서론에서 제시한 명제를 떠올려 본다. 


아무리 우리의 시선이 언론에 의해서 의도된 방향으로 통제될 수 있고 제한된 정보와 왜곡된 엔트로피에 의해서 우리의 의사결정이 불합리하게 이루어질 수 있다고 해도 우리가 통제할 수 있는 유일한 대상은 바로 우리의 시선이라는 점이다. 결국 우리가 무의식적으로 잃어버린 시선에 대한 통제권을 다시 우리의 의식으로 되찾아 오는 과정이 없이는 그 어떤 구조적 변화도 소용없는 것이다. 진보의 가치를 믿는 한 개인으로 사회의 구조적 변화가 우리가 소속된 사회를 변화시키고 좀 더 좋은 사회로 만들 수 있는 방법이라고 생각하지만 아무리 시스템이 변화해도 근본적인 변화가 이루어지기 어려운 부분은 바로 개개인이 가지고 있는 시선이다. 

의식있는 시선을 가진 구성원을 꿈꾸며... 

결국 정보 / 엔트로피를 구별할 수 있는 능력은 개인의 깜냥에 의존할 수 밖에 없다. 문제는 그런 능력은 유전적 능력이 아닌 사회의 구성원으로 자라면서 배우는 교육과 사회 구성원과의 관계를 통해서 가능하다는 것이다. 교육을 통해서 아이들에게 지식만을 제공하려고 한다면 그만큼 정보와 엔트로피는 혼재되어 어떤 것이 우리에게 유용한지에 대한 판단은 결여된 상태로 양만으로 강조될 것이다. 바로 주입식 교육의 문제점이 가지는 가장 큰 문제점은 교육 자체의 목적을 떠나서 언론에 대해 적절하게 판단할 수 있는 의식있는 구성원으로 만들 수 없다는 점이다. 자신이 가진 지식이 정보일 수도 있지만 엔트로피일 수 있다는 의식은 내 생각이 틀릴 수 있다는 가치를 만들 수 있고 이는 내 정보와 엔트로피를 다른 이의 정보와 엔트로피를 비교하며 어떤 해결 방법이 우리가 의사결정에 필요한 정보로 선택해야 하는지 확인할 수 있게 될 것이다. 결국 수많은 토론과 다양한 사회 문제에 대한 공론화에 의해 누구든 다양한 의견을 말할 수 있는 공간과 시간을 마련하는 것이 언론이 취해야 하는 적극적 태도일 것이다. 


론이 스스로의 특권과 정보력을 믿으며 이를 전달하는 공급자라고 생각한다면 언론은 힘이라고 생각할 것이다. 언론의 기능은 바로 모든 구성원이 힘을 가질 수 있도록 다양한 시선으로 바라볼 수 있는 대상을 제공해주는 것이다. 그리고 그 구성원들이 언론의 기능 안에 적극적으로 참여할 수 있도록 도와주는 것이다. 요즘과 같이 언론의 공급자와 수요자가 명확하게 구별되어 별도의 영역을 지키는 환경은 아무리 다양한 개인 미디어가 활성화되어도 우리의 시선은 좀 더 자극적인 것을 추구하고, 정보와 엔트로피의 구별조차 어려운 더 복잡한 상황을 만들 것이다. 결국 우리의 시선이 똑똑해지기 위해서는 우리가 좀더 다양한 철학과 고민으로 무장해야 한다. 그리고 이는 단시간에 가능한 것이 아닌 어쩌면 다음 세대가 다양한 철학과 사고의 연습을 통해서 만들어지는 것을 기대해야 할지 모른다. 

최소한 내 시선의 주인이 나라는 자부심을 가지기 위해서는 자신이 가진 정보가 엔트로피일 수 있고, 내가 틀릴 수 있다는 가능성에 대한 충분한 고민을 통해서 깨어 언론을 지켜봐야 할 것이다. 그렇기 때문에 언론은 무한 신뢰해야 하는 대상이 아닌 충분히 견제하고 깨어 지켜봐야 하는 대상이어야 한다. 

리의 시선을 무의식적으로 빼앗이기기 전에... 

언론은 충분한 정보를 제공하는가 - 시선의 과학