쓰레기 정보학 ─ 개인정보의 속성에 대해서

디지털 데이터의 증가와 개인이 저장하는 데이터의 절대적인 양 뿐만 아니라 우리가 모르는 사이에 저장되는 기록들은 결국 개인 정보가 되어 우리의 많은 것을 보여준다. 우리들이 친구와 이야기 나눈 대화 내용은 둘만의 이야기라 생각하며 솔찍한 이야기를 하게 되지만 부주의한 실수로 자신의 계정이 노출된다면 더이상 비밀이 될 수 없을 것이다. 스마트폰은 우리들이 다니는 장소를 기록하고 그 장소에 맞게 양질(?)의 정보를 제공해준다. 누가 어디서 무엇을 하는지 사소한 일상부터 자신이 열심히 작업한 대부분의 성과들도 디지털의 형태로 저장되게 된다. 심지어 아날로그 작업으로 만들어진 조각 작품, 요리와 같은 온라인 세상과 전혀 관계 없는 대상들도 이제는 사진으로 찍혀 온라인의 공간에 돌아다닐 수 있게 된다.

이처럼 우리는 알지 못하는 사이에 수많은 데이터와 개인 정보를 온라인에 뿌리고 다닌다. 때로는 사용자가 원하기 때문에, 제공하는 개인 정보에 따라서 적절한 정보를 보상받기 때문에 그런 정보의 제공을 어렵지 않게 생각하기도 한다. [ 빅데이터의 거품과 희망 ─ 개인 정보 & 공적 정보 ] 사적 영역에 대한 필요성을 이야기했다. 즉, 우리가 아무리 보안에 신경쓰고 철저하게 개인 정보를 챙긴다고 해도 그 정보를 담고 있는 시스템의 근본적 취약점으로 정보는 어느 순간 손쉽게 공개되어 버릴 수 있거나 시스템적 사용자의 허가권 (permissions) 은 그 의미가 약해질 수 있기 때문에 비록 개인 정보가 털린다 해도 지켜져야 하는 최소한의 개인 정보 영역을 '사적 영역 (privacy domains)' 으로 설정하고 이에 대한 시스템적 보안뿐만 아니라 법과 규제를 통한 보완을 마련해서 운영해야 한다는 것이다.

흩어지는 개인 정보에 대해서...

① 누군가 무심코 올린 택배 사진에서 개인 정보 유출을 염려해서 주소 부분은 가리고 올렸지만 사진에 올라와 있는 송장 번호나 송장 번호를 나타내는 바코드를 통해 송장 번호를 알아내 상대방 주소에 대한 정보를 알아낼 수 있다. ② 구인란에 올린 자신의 정보들은 인터넷 검색에서 나타난다. 상대방의 전화번호 뿐만 아니라 개인의 신상에 대한 내용을 조금만 관심있게 살피면 알 수 있다. ③ 상대방의 아이디를 통해서 다른 웹서비스를 검색하거나 아이디를 통해서 무심코 올린 게시판의 글을 통해 어떤 시사회에 참석하는지 상대방의 동선을 파악할 수 있다. ④ 페이스북에 올라간 위치 정보, 때로는 친절하게 '우리집 내방'과 같은 위치 정보를 지정해서 올려서 집주소의 위치를 파악할 수 있다. ⑤ 위치의 메이어 (major) 가 되기 위해 자주 가는 장소에서는 꼭 체크인 (check-in) 하여 자주 출몰하는 지역을 알 수 있게 한다. ⑥ 소셜 네트워크의 설정 정보가 노출되어 자신이 어떤 핸드폰을 사용하는지 파악할 수 있게 된다.

이 밖에도 그리 어렵지 않은 방법으로 개인 정보를 알려고 노력한다면 그리 어렵지 않게 알 수 있는 방법들은 다양하다. 이런 것이 가능한 이유는 우선은 정보를 남기는 시스템 자체가 정보에 대해서 민감하지 않게 생각하여 공개가 기본이 되어 검색 엔진에 검색이 되도록 설정을 했기 때문이다. 특히 개인 정보를 담을 수 있는 게시판, 특히 상품 수령이나 이벤트 당첨과 같은 게시판은 아이디와 이름, 그리고 간단한 개인 정보까지도 공개된 경우가 많다. 또한 잘 고려하지 않는 것 중에는 PDF 문서를 내부 열람 목적으로 올리지만 권한 설정이 제대로 되지 않아 검색 엔진에 쉽게 노출된 경우도 볼 수 있다. 이처럼 우리가 생각하지 못한 경로로 우리들의 정보는 생각보다 많은 곳에 노출되어 있다. 아무리 신경써도 시스템적 한계가 존재하기 때문에 이처럼 퍼져나가는 개인 정보는 어쩔 수 없는 부분들이 많이 발생한다.

지키려는 사적 영역에 대해서...

그런 이유로 법, 규제를 통한 사적 영역의 보호가 필요하다. 비록 자신의 개인정보가 노출되어서 누군가에 의해 악의적으로 사용이 되었을 때 강화된 처벌에 의해 악의적 사용을 했던 사용자는 법의 처벌을 받아야 한다는 사회적 책임을 법률로 정해야 하는 것이다. 이전 기술에 대한 정확한 이해가 부족했던 시절에는 해킹이 하나의 놀이 혹은 법률이 정하지 못한 범위의 행동들이어서 이에 대한 무분별한 공격과 악의적인 이용이 자주 일어났다. 인간이 만든 기술이고 근본적으로 기술을 쓰는 누군가가 존재하기 때문에 (최종 사용자 ; End User) 완벽한 시스템은 존재할 수 없다. 예를 들어 아무리 보안이 철저하여 100% 해킹이 불가능한 시스템을 만들었다고 해도 그 시스템을 사용하는 권한을 가진 사용자의 정보를 이용하면 그대로 이용가능하다는 것이다. 즉, 시스템을 사용하는 사용자가 존재하는 한 최후의 해킹은 항상 가능하다는 것이다.

이런 이유로 빈번하게 일어나는 금융 전자 사고 (해킹) 의 경우 최종 사용자를 공략하는 경우가 대부분이다. 만약 어떤 사용자가 사용하는 아이디 / 패스워드 뿐만 아니라 거래에 필요한 보안 코드 그 밖에 필요한 모든 도구를 그대로 복제해 가지고 있다면 시스템은 해킹으로 들어온 사용자를 허가된 사용자로 취급할 것이다. 즉, 인터넷 ID 와 개인정보로 이루어지는 모든 온라인 과정은 실제 사용자가 누구인지가 중요한 것이 아니라 허가된 ID 와 정보를 가지고 있는지 중요하다. 따라서 상당수의 시스템의 취약점은 사용자에게 발생하는 경우가 많다. 특히 시스템 전체 관리자도 일종의 사용자이다. 그리고 조금만 시스템 관리자에 경험이 있다면 사용자의 허가 인증보다 시스템 관리자의 허가 인증이 더 허술한 경우가 많다는데 동의하는 사람들도 많을 것이다. 결국 절대 깨질 수 없는 시스템이 불가능하 듯, 시스템만으로 보호할 수 있는 사적 영역도 불가능하다. 항상 기술적 취약점은 인간의 권한을 제한하고 책임을 물을 수 있는 사회적 통제 수단을 마련해야 한다.

무관심한 개인 정보에 대해서...

그렇다면 왜 이렇게 개인 정보가 노출되고 시스템은 불안한데 그럼에도 불구하고 더 많은 개인 정보를 만들게 되는 것일까? 가장 큰 원인은 기술적 방향이 개인 정보를 더 끌어 들이는 방향으로 설계되고 있기 때문일 것이다. 단순한 개인의 신상 정보뿐만 아니라 개인의 위치, 선호도 뿐만 아니라 온라인 상의 관계를 맺고 있는 네트워크까지 파악할 수 있어 이웃을 분석하는 것을 통해서 개인이 제공하지 않으려는 내용까지도 알아낼 수 있다. 예를 들어 관계를 맺고 있는 온라인 상의 친구들의 정치 성향 혹은 부분적으로 올려진 개인 신상, 혹은 올려지는 글의 성격들만 모아보아도 어떤 성향의 사람인지 파악하는 것은 어렵지 않다. 겉으로는 네트워크에서 다양한 사람들을 만나볼 수 있도록 배려하는 좋은 웹서비스를 제공하는 것처럼 보이지만 관계와 활동을 통해서 개별화된 사용자를 그룹으로 묶을 수 있게 된다. 보통 네트워크를 노드 (nod) 와 라인 (line) 으로 표시한다. 자주 접할 수 있는 자신의 네트워크 관계도를 그려보면 노드에 해당하는 각 사용자들이 어떤 목적으로 모인 사람들이 주로 모였는지 그룹을 만들 수 있다. 그리고 이런 그룹들이 몇개의 그룹인지를 통해 그 사람이 오프라인에서 관계를 맺는 사람들의 관심사를 파악할 수 있다.

이런 관심사 혹은 그룹의 성격을 파악하는 것은 왜 중요할까? 우선 관심사는 광고와 연결이 된다. 막연하게 의뢰받은 광고를 올리는 것은 무척 위험하고 비효율적인 방법이다. 스포츠에 전혀 관심없는 상대방에게 스포츠 용품 혹은 스포츠 동호회 광고가 뜬다면 별로 좋아하지 않을 것이다. 그러나 사용자가 낚시에 관련된 사람들이 하나의 그룹으로 모여 있다면 이런 개인의 기호 (favorites) 를 통해 관련 광고를 적극 추천할 수 있을 것이다. 즉, 이미 소비자가 어떤 것을 좋아할지 알고 들어가는 것이다. 그러나 꼭 이런 그룹화 분석이 항상 맞는 것은 아니다. 비록 스포츠를 좋아하는 사람들이 대부분인 특정 그룹이 있다고 해도 우연히 해당 그룹은 스포츠를 좋아하는 사람이 다수인 대학 모임일 수 있다. 이런 경우에는 노드와 노드 사이 연결된 네트워크의 라인이 얼마나 활동량이 많은가 특히 특정 주제에 대한 반응이나 민감도에 대해서 분석하여 이런 예외성을 분석할 수 있다. 중요한 것은 네트워크를 맺고 있는 사람들 사이에는 사람들이 무엇을 원하는지 그 욕구를 좀 더 정확하게 파악할 수 있다는 것이다.

따라서 사용자는 무관심한 듯 자신의 이야기를 나누고 자신이 관심있는 대상을 찾아갈 뿐이지만 이를 통해 사용자가 어떤 '욕구 가능성'이 있는지 파악할 수 있게 되는 것이다. 우리가 무관심하게 흘리는 대부분의 개인정보는 그다지 우리가 정말 신경쓰지 않는 내용들이 대부분이란 점이다. 너무 일상적이고 너무 평범해서 신경쓰지 않는 정보들이 사실 우리의 자연스러운 모습, 자연스러운 욕구를 보여주는 좋은 정보가 된다. 결국 신경쓰고 가꾸는 정보들보다 무심하게 넘어가는 지극히 평범한 정보들이 우리들의 많은 것을 보여주는 것이 개인정보의 중요한 속성이다.

가치있는 개인 정보에 대해서...

사용자들은 별로 신경쓰지 않지만 그리고 개인의 입장에서 중요하지 않은 개인 정보들도 대규모로 모으면 상업적 가치가 높은 개인 정보들이 많다. 특히 개인의 상품 구매, 활동 영역 및 관심 분야과 같이 소비자의 소비 유형과 관련이 깊은 정보들을 생각할 수 있다. 이는 사생활에 관련된 내용이지만 여러 사람들의 정보가 모이면 이는 어떤 지역에 어떤 상품이 소비가 많이 이루어질 수 있다는 좋은 마케팅 데이터가 될 수 있다. 이런 이유로 소비를 직접 관찰할 수 있는 데이터를 끌어오기도 한다. 소비와 직접 연관된 데이터는 지불에 관련된 처리를 담당하는 데이터, 예를 들어 신용카드 및 선불카드와 같이 지불의 내역까지도 확인할 수 있는 데이터가 우선이지만 적립 포인트와 관련된 정보들도 적립금이 직접 소비량과 소비 패턴, 지역 등을 확인할 수 있다. 따라서 다양한 방법으로 소비자의 구매 성향을 파악하고 이를 데이터로 관찰하려는 많은 기업들이 생기게 된다.

대부분 소비에 관련된 데이터를 모으기 위한 목적은 알려주지 않고 대부분 소비자를 위한 혜택, 포인트 결재와 같은 형태로 소비자에게 사용을 유도하게 된다. 특별히 개인의 입장에서 사소한 사생활을 조금 넘기는게 뭐 문제가 되지 않거나 그보다 더 큰 혜택이 주어진다는 보상 심리에 별 부담없이 사생활을 넘기기 쉽다. 즉, 우리가 무의식적으로 넘기는 대부분의 개인 정보는 어떤 과정으로 어떤 기관, 회사에 그 정보가 저장되고 그 정보가 어떤 목적으로 사용될 수 있다는 내용은 알기 힘들고 오히려 눈 앞에 보이는 실질적 이득에 더 집중하게 되게 된다. 즉, 개인 정보와 맞 바꾸는 무엇인가가 존재한다는 사실은 제대로 파악하기 힘들다 왜냐하면 그런 이득은 당장 몇명의 개인 정보로 나타날 수 있는 모습은 아니지만 기과 및 회사가 약속하는 당장의 포인트 및 할인 혜택은 눈 앞에 실질적 이득을 보이기 때문이다. 그러나 이윤을 목적으로 하는 기업이 이득이 일어나지 않는데 무료로 자선사업을 할 이유는 없다.

냉정한 입장에서 구글의 다양한 서비스가 무료라고 이야기하는 것은 거짓이다. 개인이 서버를 구매하고 이를 운영하며 이메일 서비스 및 관련된 서비스를 사용하려고 해도 기본적인 운영 비용이 들어간다. 단지 사용자의 인터넷 사용을 향상시키기 위해서 다양한 서비스를 무료로 제공한다고 해도 사용자들은 이미 다양한 인터넷 광고 시스템의 소비자가 되어 있는 상태이다. 문제는 능동적 사용자인가, 수동적 사용자인가이다. 능동적 사용자라면 자신의 관심사에 맞게 알맞는 상품들을 보여주는 광고가 신기할 것이다. 수동적 사용자라면 다소 귀찮고 불편해도 그리 쓰는데 불편을 느끼지 않을 것이다. 미국에서 웹 사이트 개발자로 일하는 친구의 이야기를 인용하자면 인터넷 광고의 묘미는 사용자가 '나를 괴롭힐 정도로 광고가 많지 않다고 느낄 정도의 정돈된 템플릿 속에서도 순간 보이는 잠깐의 광고가 더 효과적'이라고 이야기한다. 이와 동시에 보다 넓은 영역에서 광고를 잠깐 잠깐 노출시키는 것이 더 효과적이란 것이다. 즉, 개인 사용자의 블로그를 적극 활용해서 이를 하나의 광고 플랫폼으로 이용하도록 끌어 들이는 것도 좋은 전략이 된다는 것이다.

이에 비해 국내의 많은 광고 시스템은 복잡하고 심지어 본문 내용을 방해하거나 광고를 클릭하지 않으면 찾았던 내용을 볼 수 없는 수준까지 화면 구성을 만드는 경우가 많다. 특히 언론사까지도 양질의 기사를 보여주기 보다는 광고를 위해 기사가 존재하는 것이 아닐까 싶을 정도이고 특히 흥미유발의 기사인 듯 라인 링크를 만들어 놓고 이를 광고와 연결시키는 경우도 쉽지 않게 볼 수 있다. 소비자들이 자신의 개인 정보를 제공하려는 이유는 그만큼 충분한 보상이 느껴진다 생각하기 때문이다. 즉, 당장의 보상이 존재하지 않고 자신의 본 목적마저도 방해하는 광고가 가득하다면 사용자들은 광고에 의해 불쾌함을 느끼게 될 것이다. 광고를 단순 소비하는 소비자의 입장이든, 포인트와 할인 혜택을 위해 사생활을 제공하는 입장이든 중요한 것은 개인 정보는 분명히 가치가 있다는 것이다. 그리고 그 가치를 어떤 방식으로 뽑아낼 것인가는 사실상 인터넷 서비스 업체의 비지니스 모델이 된다. 문제는 그 비지니스 모델이 개인 정보를 상품으로 판매하거나 수집한 개인 정보가 개인들에게 예상하지 못한 무기가 되어 되돌아 오는 비도덕적 상황을 만들지 말아야 한다는 것이다.

의도적인 개인 정보에 대해서...

개인 정보는 대부분 연결 고리를 가진다. 예를 들어 이벤트 응모를 위해 올린 이메일이 어떤 가치를 가지는지 별 생각없이 올릴 수 있다. 이렇게 올려서 인터넷에 노출된 경우 개인 정보는 어떤 곳에 가입되었는지 혹은 어떤 서비스를 사용하고 있는지 가장 기본적인 정보부터 만약 다량의 이메일 / 패스워드가 해킹되었을 때 주요 목표가 될 수 있다는 점도 생각할 수 있다. 예전에 광고 문자 / 메일이 와서 '본 광고 수신을 원하지 않는 경우 클릭해주세요' 와 같은 문구에 친절하게 대응해주는 사람을 본적이 있다. 그러나 광고를 보내는 사람이 친절하게 '이 사람은 광고를 원하지 않는구나' 하고 광고 수신 목록에서 제거해주면 고맙지만 그렇게 대응한 목록만 모으면 실제 수신을 하는 소위 '진성 사용자'를 골라낼 수 있게 된다. 즉, 실제 사용하는 사람이 있는 계정이라는 것을 확인시켜 주는 경우이다.

특히 대부분 이메일 계정을 통해 얼마나 많은 것을 알 수 있을까 ... 생각하며 습관적으로 다양한 웹 서비스에 가입하는 경우가 많다. 그러나 이는 흩어져 있는 개인 정보를 충분히 잘 모으면 한 사람에 대한 충분한 정보로 구성할 수 있는 연결 고리가 되어 준다. 따라서 이런 경우에 대비해 소셜 미디어에 가입하는 목적으로 이메일을 자주 사용하는 계정과 다르게 가입하는 것도 좋은 방법이다. 최근 이메일 서비스에는 별명 (alias) 서비스를 제공해주기 때문에 이런 별명 서비스를 활용하거나 쥐메일의 경우 자신의 계정뒤에 account+shopping@gmail.com 과 같은 형태로 이메일을 입력해도 자신의 계정에 수신될 수 있는 기능이 있기 때문에 예를 들어 ebay 에 가입할 때 myaccount+ebay@gmail.com 과 같이 지정할 수 있다. 이렇게 지정한 경우 해당 이메일이 가입 서비스 이외 다른 곳에서 노출된다면 해당 서비스가 최초 공개 지점인 것을 확인할 수 있다. [ 이메일 서비스를 생각한다 - 매력적인 웹서비스를 위해... ]

이전에는 garbage in garbage out 이라고 해서 입력 데이터가 양질 (quality) 이 아니면 결과도 양질의 결과를 기대하기 어렵다고 이야기했지만 때로는 의도된 쓰레기 값이 보안적 측면에서는 충분한 가치를 가질 수 있다는 것도 흥미로운 부분이다. 즉, 데이터는 거짓을 이야기하지 않지만 데이터를 만드는 사람은 충분히 의도를 가지고 거짓 데이터를 만들 수 있다는 것이다. 그런데 이런 쓰레기 정보들은 역설적으로 무엇이 사실인지 확인하는 수단이 될 수 있다.

의도적인 추적 정보에 대해서...

범죄 영화를 보면 조직원 중에 첩자, 프락치 등이 잠입해서 적에게 정보를 알리거나 결정적 순간에 배신의 아이콘이 된다. 가장 기억에 남는 영화 중에 무간도(無間道; 2002) 는 경찰과 범죄 조직 사이 오랜동안 상대방의 조직과 경찰에서 성장하는 첩자를 그린다. 미국 경찰 드라마에 빠지지 않고 들어가는 이야기도 위장 경찰 (undercover) 에 대한 내용이다. 그리고 이야기 속에는 내부 첩자를 어떻게 잡아내는가, 그리고 어떻게 위기를 모면하는가를 보여준다. 대부분 내부 첩자를 잡아내는 과정은 거짓 정보를 흘려서 그 거짓 정보가 어떻게 흘러가는지 그리고 누구를 통해서 흘러가는지를 파악하기 위해 의심 인물들에게 서로 다른 정보를 주는 것이다. 앞서 예를 든 것처럼 자신의 이메일 계정 뒤에 +ebay 와 같이 특정된 (exclusively) 정보를 붙여 해당 정보가 어떻게 흘러가는지 확인하는 과정이다. 그래서 첩자는 항상 무엇이 거짓인지 무엇이 사실인지 확인하는 과정이 필요하다. 습관적으로 확인 (double check) 하고 소위 이차 계획 (backup plan; plan B) 를 구상해야 하기 때문에 첩자들은 스트레스가 이만저만 아닐 것이다.

이처럼 의도적인 추적 정보는 개인 정보가 어떻게 흘러가는지 확인하는 좋은 도구가 된다. 본 블로그에서 가장 많은 검색어 중 하나는 '페이스 북에서 친구가 뜨는 순서' 이다. 페이스북 대화목록이 어떤 순서로 보이는지 그 원리와 순서를 알고 싶어한다. 당연하지만 페이스북은 알려줄리 없다. 그런데 많은 사람들의 공통된 이야기는 우연히도(?) 자신이 관심있는 상대방... 특히 이성 친구들이 상위에 보인다는 것이다. 마치 페이스북이 자신의 깊은 속마음을 알려준다 생각할지 모른다. 그러나 알고 싶은 의욕이 강하다면 몇개의 다수 계정을 만들어서 다수의 컴퓨터 (요즘은 가상화 기술이 있어 좀 더 수월하다.) 혹은 더 원한다면 가상의 접속 위치 (Proxy 서버 및 VPN 과 같이) 를 의도하여 접속하였을 때 어떤 결과가 만들어지는 확인해 보는 것이다. 대부분 사용자들은 제한된 숫자의 컴퓨터와 제한된 브라우저 환경 특히 개인의 정보 및 접속 기록이 자세히도 기록된 브라우저로 접속한다는 것이다. 따라서 완전히 통제된 상태의 가상의 사용자를 만들 수 있다면 페이스북이 어떻게 친구 목록을 보여주는지 짐작하기 쉬울 것이다. 사실 그보다 자신이 생각했던 원리들 중 맞지 않는 내용을 제거할 수 있을 것이다. 마치 내부의 첩자를 찾아내기 위해 의도적인 활동을 만드는 것과 비슷하다.

최근 미 국가 정보기관의 일반 사용자까지 포함한 광범위한 개인 데이터 수집이 많이 이야기된다. 일반적 상식으로 국가가 그리 중요하지 않는 익명과도 같은 사용자들의 데이터를 왜 수집하는가에 의문을 품는 사람들도 많지만 한편으로 설마 나같은 개인 사용자까지 해당할까 무시할 수 있지만 수집된 양으로 보면 인터넷을 매일 사용하는 사용자들만 생각하면 최소 개인당 월 1000건 이상의 개인 데이터는 수집되었다고 한다. 단지 그런 데이터들이 별로 상관없다 (irrelevant) 판단되어 그냥 지나쳐 넘어갔을 뿐 마음만 먹는다면 충분히 캐낼 수 있다는 점이다. 이미 엉뚱하고 황당한 사건들이 많이 일어났다. 미국 여행을 가려는 유럽 사람이 자신의 트위터에 재미있게 놀겠다 란 뜻으로 '폭파해버리자' 라고 적어놓자 미국 출입국 심사에서 몇시간동안 감금되는 사건이나 페이스북에 장난으로 폭발물처럼 꾸민 친구 생일 선물을 공개하자 몇시간 후에 경찰 특공대가 자신의 집에 투입된 사건 등 개인 영역이고 자신들의 친구들만 볼 수 있는 공유 정보임에도 정부 관계자들은 이를 알아내고 과잉 대응했던 것이다. 이런 사건들이 종종 일어나자 인터넷 상에는 'SWAT (경찰 특공대) 를 자신의 집에 초대하는 방법'을 조소섞인 내용으로 돌게 되었다.

이처럼 '의도한 쓰레기 정보'들은 특정 행동, 결과가 유발되는지 확인하는 것으로 더이상 쓰레기 정보가 아닌 것이다. 쓰레기 정보들은 사실 이미 많은 부분 우리들의 정보 데이터 처리에서 많이 사용된다. 패리티 비트 (Parity Bit) 는 정보의 전달 과정에서 오류가 생겼는지 아닌지 확인하는 부가적인 데이터이다. 실제 전달하려는 데이터는 아니지만 전달되는 데이터가 전달 과정에서 소실되거나 변질되지 않았는지 확인하는 목적이다. 패리티 비트는 전송된 정보가 오류라는 사실은 알려주지만 직접 오류의 내용을 수정하지 않는다. 즉, 전송된 데이터의 패리티 비트가 맞지 않는다면 수신하는 쪽은 송신하는 쪽에 아까 보낸 데이터를 다시 보내달라고 재차 요청하게 된다. 즉, 데이터의 진실성에 대해서 확인하지만 무엇이 진짜인지는 제대로 확인할 수 없다. 유사하지만 내부 첩자를 잡아내는 과정도 비슷하다. 의도한 쓰레기 정보를 추가하는 것은 무엇이 누가 첩자인지는 확인하고 제거할 수 있지만 그렇다고 딱히 그 첩자를 제거하여 특별히 이득이 되는 요소는 없다는 점이다. 그런 의미에서 쓰레기 정보학에 추가되는 데이터들은 어떤 부분이 문제가 된다는 문제의 확인은 해줄 수 있고 어디를 고쳐야 한다는 정보는 줄 수 있지만 제거되어야 할 부분이 제거된 이후 무엇이 향상되었는지에 대한 구체적인 이득을 계산하기 어렵다는 특징을 가진다.

일상적인 추적 정보에 대해서...

너무 완벽한 논문은 매력없을 때가 많다. 특히 오탈자 하나 없는 경우는 그렇다. 의도하지 않은 경우는 아니겠지만 가끔... 종종 논문 표절 이야기가 나오면서 가장 많은 증거로 제시되는 것은 원문에 포함된 오탈자까지도 동일하게 복사된 경우이다. 이에 다양한 변명을 하지만 사실 일반적 상식으로 오탈자까지 동일하게 틀리는 경우는 표절을 하지 않고서는 동일인의 영혼이 빙의되어 동일한 오탈자를 표준어로 굳게 믿는 경우가 아니라면 거의 불가능한 일이다. 의도하지 않았지만 옥의 티도 때로는 진실에 접근할 수 있는 좋은 도구가 되어 준다. 이것도 일종의 쓰레기 정보가 주어 부정한 행동을 했는지 아닌지 알 수 있게 해준다. 특별히 이런 경우 논문이라는 중요한 작업에 남이 쓴 논문을 한번이라도 읽어 오탈자라도 고칠려는 노력도 안하고 Ctrl-C, Ctrl-V 했다는 의혹도 심하게 받을 것이다. 가끔 이런 의도된 오류들도 충분히 가치를 줄 때가 많다.

쓰레기 정보라고 말하기 어렵지만 일상적인 사생활을 기록하는 것도 그리 나쁘지 않은 방법 중 하나이다. 언제 어디서 무엇을 했는지를 모두 기억할 수 있는 사람은 그리 많지 않다. 그러나 아주 빠른 시간에 자신의 흔적을 남길 때 구체적인 기억으로 이끌어 낼 수 있는 좋은 방법이 되기 때문이다. 세상이 복잡해지고 사람들 사이에 오해가 많이 발생할 수록 이런 사생활에 해당하는 내용을 최소한 사적 영역으로 기록하는 것도 필요하다고 생각한다. 사실 스마트폰은 이런 기능을 이미 많은 부분 수행하고 있다. 사용자와 거의 붙어 있는 스마트폰의 경우 기본적인 설정을 조정하지 않는다면 사용자가 어디에 있는지 위치 정보를 수시로 기록할 수 있다. 위치 기반 광고만 보아도 최소한 한번 이상은 사용자의 위치를 보낸다는 것은 예상할 수 있다. 문제는 이런 정보들이 일련된 개인의 사생활 내용으로 기록되는가 아닌가의 문제이다. 이부분은 수집하는 회사와 관계를 두고 어떤 정보를 수집할 것인지 약관 등을 통해 수집됙고 법률 등을 통해 제한될 것이다. 스마트폰이 기록하는 이런 사생활 내역을 오히려 개인의 기록으로 구체화 시킬 필요가 있을까? 구글 계정과 구글 나우 (Google Now) 를 사용한다면 [ https://maps.google.com/locationhistory ] 에 들어가면 어떤 위치 정보들이 기록되었는지 확인할 수 있다. 자신도 모르게 기록되는 정보가 무엇인지 확인하고 이를 자신이 관리하는 데이터로 끌어낼 필요도 있다.

최근의 사건들이지만 많은 경우 사용자가 기록하지 않아도 기록으로 남게 된 정보에 대한 법적 효력 혹은 법적 결정에 상당한 영향을 주는 경우가 많다는 것이다. 예를 들어 개인이 일상적으로 대화했던 기록이나 개인의 위치 정보 등은 상당한 법적 효력을 가지게 된다. 물론 이에 대해서 공정한 법집행이 이루어진다면 문제가 없지만 상당 부분, 특히 미국의 국토 안보와 테러에 관련된 내용의 경우 일반 사용자, 학생들이 뜻하지 않게 테러리스트 혹은 테러를 일으키지도 않았는데 테러를 일으킬 의도를 가진 사람으로 지목되어 인권이 무시되는 경우가 있었다. 물론 국가의 안보는 중요한 요소이지만 문제는 개인의 사생활 영역이 침범당해 혹은 개인의 사생활 정보는 디지털 데이터이기 때문에 특별히 그 데이터의 진위 여부를 교차 검증하기 어렵다는 한계를 가진다. 즉, 어떤 특정 정보 기관이 의도를 가지고 개인 사생활 정보를 조작할 수 있다면 충분히 한 개인을 테러리스트로 만들기에 충분한 위치 정보와 의도성을 만들 수 있다는 점이다.

자신도 모르는 사생활을 시스템이 기록한다고 해서 개인이 특별히 잘못을 하지 않으면 무엇이 문제일까 싶지만 디지털 데이터는 생각보다 아날로그 영역의 증거에 비해 그 진위성을 확증하기가 어렵고 일방적으로 데이터가 제공될 때 즉, 사용자는 의식하지 못하는데, 수사하는 쪽에서 전화 통화 기록이나 위치 정보 등을 제공할 때 수사하는 쪽이 제공하는 데이터가 확실하다고 어떻게 검증할 수 있는가이다. 최근 디지털 데이터의 수사 과정에서 가장 큰 문제는 그 사생활 내용에 대해서 협의 사실을 피의자가 인정한다면 별 문제가 안될 수도 있지만 정 반대로 피의자가 인정못하는 경우 디지털 데이터가 조작되었을 때는 어떻게 이를 확인할 수 있는가이다. 소위 조작된 형태의 디지털 데이터를 어떻게 검증할 수 있는지 방법이 별로 없다. 이런 경우 믿고 싶지 않지만 사법적 폭력을 위한 충분히 좋은 도구로 사용될 가능성이 높다는 것이다.

목적있는 정보 사용에 대해서...

개인 정보의 가장 큰 속성은 그 중요성이 강조되지만 그 중요성 만큼 사용자는 크게 의식하지 않는다는 점이다. 개인 정보에 대한 확실한 대책은 전혀 없다. 그게 사실이다. 문제는 얼마나 악용되는 비율을 줄일 수 있는가이다. 그렇기 위해서 단순히 기술적 방법으로 모두 막을 수 없다는 공감대가 형성되어야 한다. 개인 정보는 말그대로 개인의 사유이기도 하지만 시스템의 허술함은 개인의 사유가 쉽게 노출되는 너무도 큰 취약점을 만들어 버렸다. 그리고 그 취약점이 제대로 보완되기도 전에 시스템은 확대 생산되고 그에 따라 사용자들은 그 중요성을 인식하기도 전에 이미 너무 많은 정보를 온라인에 올려놔 버렸다.

따라서 문제의 시선을 다르게 볼 필요가 있다. 개인 정보의 노출에 의해 발생하는 문제점에 대해서 심각하게 받아들이고 그에 대한 피해와 책임을 강하게 규제해야 한다. 대규모의 개인 정보가 해킹당했는데 정작 그 정보를 지켜야 하는 기업은 거의 책임을 지지 않는다면 기업은 점점 이에 대해서 소홀하게 다룰 것이다. 즉, 개인 정보가 얼마나 가치있는지를 평가하는 것은 개인의 인식도 중요하지만 책임의 크기가 더 중요하다. 살인범이 소매치기보다 더 무거운 형량을 받는 이유는 살인이 소매치기보다 더 무거운 범죄라는 평가가 내려졌기 때문이다. 마찬가지로 개인 정보를 얻어 만드는 이득은 회사가 챙기고 그에 대한 책임은 가지지 않는다면 이에 대해서 누가 중요하다고 생각할 수 있겠는가.

목적있는 정보 사용을 위해서 그만큼 의식도 필요하지만 그와 함께 사용자들이 자신의 개인정보를 ⓐ 어떻게 보호할 수 있는지, 최소한 ⓑ 노출된 경우 얼마나 그 피해를 최소화 시킬 수 있고, ⓒ 그에 대한 책임을 물을 수 있는 정보를 얻을 수 있는가도 신경써야 한다는 것이다. ⓒ 의 경우를 위해서 쓰레기 정보학은 하나의 좋은 대안이 될 수 있다. 정보학의 관점에서 보았을 때 국내의 주민등록번호처럼 멍청한 시스템도 그리 많지 않다. 생년월일 뿐만 아니라 성별, 출생지를 알 수 있고 이 번호가 맞는 (유효한) 정보인지 마지막 번호로 알려주는 번호 하나만으로 완결된 정보를 제공하기 때문이다. 당연하지만 개인 정보는 수집하려는 노력에 따라서 어느 정도 수집할 수 있다. 문제는 얼마나 노력이 필요한가이다. 아주 간단한 노력만으로 상대방의 개인 정보의 많은 부분을 알아낼 수 있다면 많은 문제가 발생할 것이다. 같은 의미로 한동안 떠들석 했던 고위 법조인의 혼외자식이라며 알아내는 과정도 주민등록번호 하나로 사생활이 노출되는 단적인 예를 보여주기도 했다. 따라서 개인 정보에 관련된 내용은 분산 (distributed) 될 수록 개인 사생활 (인권) 차원에서 더 좋다.

따라서 일상의 생활에서 적절하게 쓰레기 정보학을 이용하면 책임을 묻기 위해서도 유용하다. 본 블로그에도 본문의 무단 복사를 막기 위해 무단으로 복사할 경우를 대비해서 오탈자와 본문에는 보이지 않지만 그대로 복사한 경우 남을 수 있는 내부 코드를 포함하고 있다. 이런 의도된 쓰레기 정보들은 목적을 가지고 있기 때문에 그 목적성은 문제가 발생했을 때 중요한 단서로 작용하게 된다. 따라서 우리의 개인 정보를 단순히 지키려고 하는 노력 뿐만 아니라 노출되었을 경우 이를 확인할 수 있는 쓰레기 정보를 의도적으로 첨가하는 것도 개인 정보를 지키는 하나의 노력이 될 것이다. 우리가 개인정보를 관심있게 관리하고 이에 대한 적절한 대책을 마련한다면 그 피해를 원천 봉쇄할 수 없지만 최소화할 수 있거나 문제 해결을 위한 좋은 해결책이 될 것이다.

Garbage In Garbage Out 의 시대에서 이제는 Garbage In Fancy Out 을 기대하며...