책/요약

모두 거짓말을 한다, 세스 스티븐스 다비도위츠

권열 2020. 3. 16. 12:56


- 구글 트랜드로 밝혀낸 충격적인 인간의 욕망


  빅데이터는 직감으로 의존하던 판단 양식과 여론조사의 맹점을 극복할 수 있는 데이터 결과를 보여준다. 빅데이터는 기존 여론조사의 시간, 비용의 한계를 넘어설 뿐만 아니라 데이터를 바라보는 새로운 시각으로 새로운 결과를 도출해내는 장점이 있다. 하지만 빅데이터의 분석으로는 할수 없는 일이 분명이 있으며, 종종 윤리적인 문제를 야기하므로 취급하지 말아야 할 것을 분명히 해야 한다.
  

  기존의 실 설문조사에서 사람들은 거짓말을 하거나 말하지 않는 진실로 어긋나는 결과를 보여주곤 했다. 최근엔 트럼프 대통령 선거 결과와 관련해서 특히나 여론조사의 문제점이 조명되었다. 사람들은 실제로 창피하게 느끼는 점에 대해선 익명임에도 거짓말을 쉽게 한다는 것이다. 침묵과 거짓말로 결과를 예측하지 못한 여론조사와 다르게 구글 트랜드 검색을 통한 데이터 과학은 정확히 트럼프 대통령의 당선을 예측했다. 빅데이터는 인간의 욕망, 두려움, 혐오감정을 거짓없이 드러내어 이러한 여론조사의 한계를 보안할 수 있다. 섹스, 인종차별과 같이 숨기고자 하는 측면의 조사일 수록 빅데이터 분석은 강력한 힘을 나타낸다. 또한 이제껏 직감을 기반으로 해온 판단에 얼마나 많은 오류가 발생했는지 책에선 다양한 예시들로 설명한다.
  

  기존 데이터 수집에는 시간과 기간이 많이 소요되었다. 월간 실업 통계의 경우 전화 설문조사 후 나온 결과는 3주가 지난 데이터 이며, 미국 질병통제 예방센터의 독감데이터도 마찬가지이므로 긴급히 대비해야할 데이터의 결과가 너무나 뒤늦어 예측이 어긋나는 결과를 초래하곤 한다. 그러나 데이터 과학은 증상 검색을 바탕으로 분석하는 등의 새로운 접근법으로 이를 보안할 수 있는 무기를 준다. 뿐만 아니라 신체 데이터, 단어 데이터, 사진 데이터 등 데이터 분석은 근접하게 밀도 있게 대상을 분석하거나 광범위한 진실을 드러내는 역할을 한다. 무작위의 실험을 통해 뚜렷히 설명할 수 없는 인과관계의 결과를 보여줌으로써 이들을 활용하여 퍼져있던 편견을 정정하고 사회적으로 해결해야 할 새로운 접근의 대책법을 마련한다.  
  

  하지만 빅데이터로 할수 없는 일이 분명하게 있다. 주식시장 예측 같은 경우엔 차원의 저주 때문에 빅데이터로도 할수 없는 한계가 있다. 뿐만 아니라 숫자가 말해줄 수 없는 대다수가 존재하므로 기존의 여론조사처럼 개개인의 사람에게 묻고 대답을 얻는 사려깊은 형식은 늘 보안되어야 한다. 빅데이터는 때때로 윤리적인 문제와 충돌한다. 예를 들어, 기업에서 SNS를 통해 채용 당사자를 선별하고 검열하는 것은 문제가 되며, 범죄 행위 방법에 대해 검색을 하는 사람일 수록 범죄를 일으킬 확률이 높다는 이유로 검색하는 개인을 일일히 검열하여 이들을 막는 것은 윤리적으로 문제가 된다. 다만 한 지역의 검색 패턴에서 범죄에 관련된 검색량이 빠르게 증가한다면 치안과 보안에 신경을 조금 더 쓴다는 식의 예방 행동까지는 할 수 있겠으나 개인의 검열을 위한 증거로 들이대선 안된다.  
  

  빅데이터는 문제점을 가지곤 있으나 기존의 분석의 맹점을 보안할 뿐만 아니라 이제껏 볼수 없었던 측면의 결과까지도 보여주는 강렬한 과학적 무기이다. 과학적 사실과 결과를 증명한다는 측면에서 빅데이터 역시 과학으로 인식해야 한다고 생각한다. 이제껏 상업적으로 빅데이터가 이용되는 증거들을 봐왔기 때문에 빅데이터로 활용할 수 있는 사회적 도구로서의 역할을 생각할 필요가 있다.