http://m.biz.chosun.com/svc/article.html?contid=2014103101902
TED 명사 특강
수잔 에트링거 알터미터그룹 산업애널리스트
- ▲ 수잔 에트링거
오웰이 테크놀로지의 포로가 되지 않을까 우려했다면, 헉슬리는 사소한 것만 넘치는 문화로 전락할까 봐 걱정했다. 오웰이 진리가 은폐되는 세상을 두려워했다면, 헉슬리는 정보의 홍수 속에서 진실이 익사할까 봐 염려했다.
하지만 우리는 수동적으로 테크놀로지와 데이터를 받아들이는 존재가 아니다. 질문을 던지고 해석하면서 사고를 끌어낸다. 데이터의 바다에서 중요한 건 양이 아니다. 사진, 글, 영상, 음성 등 다양한 데이터를 통합해서 분류하고 맥락을 파악하는 작업이 필요하다. 데이터 개수를 세는 게 아니라 이해하는 게 목적이기 때문이다.
일리노이대 의료 미디어 연구소에서는 금연이란 주제를 놓고 어떻게 대화하는지 분석했다. "전자 담배는 어때?" "금연하는 좋은 방법이 없을까?" 이를 위해선 사람들이 'smoking'을 어떤 의미로 쓰느냐를 알아야 하는데, 트위터를 조사해 보니 smoking은 크게 4가지 의미로 쓰였다. 담배 피우기, 마리화나 피우기, 훈제 갈비(smoking ribs), 그리고 엄청나게 화끈한 여자(smoking hot women)(웃음). 복잡하다. 사람들이 언어를 사용할 땐 은유와 속어, 은어를 마구 섞기 때문에 데이터를 분석하면서 이런 측면을 감안해야 한다.
이 연구소에서는 금연 광고에 담배를 자주 피워 목에 구멍이 난 여성을 등장시키면 효과가 있을까 조사했다. 한계는 있지만, 연구소는 그런 광고가 충격을 줘서 미래 행동에 영향을 줄 수 있다고 결론 내렸다.
오래전 레이건 전 대통령은 "사실이란 멍청한 물건"이란 표현을 썼다. 반드시 틀린 말은 아니다. 사실 자체는 멍청할 수 있다. 오용이나 왜곡에 취약하기 때문이다. 사실, 즉 데이터 자체는 아무 의미를 만들어내지 못한다.
관건은 비즈니스나 일상에서 비판적인 사고력에 더욱 많은 시간을 쏟는 것이다. 이 시대는 엑사바이트(2의 60승)의 데이터를 광속(光速)으로 처리하고, 이 때문에 잘못된 결정을 과거보다 더 자주 할 수 있으며, 그런 결정이 끼치는 영향도 훨씬 크다.
따라서 인문학과 사회학, 사회과학, 수사학, 철학, 윤리학에 더 많은 시간을 쏟아야 한다. 그래야 빅 데이터 분석에 중요한 맥락(context)을 찾을 수 있고 비판적 사고력을 키울 수 있기 때문이다. 이럴 때 확증 편향(신념과 일치하는 정보만 받아들이는 경향)과 잘못된 인과관계의 오류(단순 선후 관계 사건을 인과관계로 잘못 해석하는 것)를 피할 수 있다.
고교 시절 수학 선생님은 문제를 풀고 나면 항상 "어떻게 풀었는지 보여달라"고 요청했다. 그래야 문제를 제대로 이해했는지 파악할 수 있다고 봤기 때문이다.
빅 데이터도 마찬가지다. 이 데이터가 정말 진실을 나타내는가? 질문을 던지는 것이다. 어렵고 골치 아프지만 계속 자문해야 한다.
앞서 말한 목에 구멍 난 여성 사진을 쓴 금연 광고에 대한 트윗 중 87%는 공포감을 표현했다. 그런데 그렇다고 그들이 담배를 끊을 거라고 결론이 나왔을까? 아니다. 데이터 분석은 과학이지 마술이 아니기 때문이다.
데이터가 넘치는 세계가 반드시 디스토피아일 필요는 없다. 우리는 비판적 사고를 존중하고, 사례 속에서 영감을 얻어야 한다. 그러면 수퍼 히어로 영화에서 말하듯 우리의 힘을 좋은 데 사용할 수 있다.
댓글 없음:
댓글 쓰기