데이터의 시각화(data visualisation)는 것은 복잡한 정보를 이용해 강력하고 세련된 이미지를 만드는 것이지만, 사람들을 현혹시킬 가능성도 있다.
위장(camouflage)이란 일반적으로 주위 환경과 조화를 이룬다는 것을 의미한다. 한 세기 전 전함들이 잠수함을 피하기 위한 필수 조건이었고, 변화무쌍한 바다 및 하늘과 대비해 자신의 존재를 휘어진 파도나 굴뚝인 것처럼 보이게 하는 것이었다.
그렇게 현란한 위장(dazzle camouflage)은 구불구불한 글자들을 추상적으로 모아 얼룩무니 패턴을 통해 구현되었다. 눈부신 배를 탐지하는 것은 어렵지 않지만, 잠망경 조종수의 임무는 어뢰를 발사하기 전에 배의 속도와 방향을 빠르게 판단하는 것이었다. 현란한 위장은 그릇된 판단을 일으킬 목적이었으며, 효과를 보았다는 증거도 많다.
이제 데이터의 시각화에 대해 얘기해 보자. 데이터 시각화 하면 플로렌스 나이팅게일을 떠올리는 사람도 있을 것이다.
나이팅게일은 역사상 가장 유명한 간호사일 뿐만 아니라 아름다운 시각화 기법인 “콕스콤브 다이어그램(Coxcomb diagram)”의 창시자이기도 하며, 왕립 통계 학회(Royal Statistical Society)의 최고 여성 회원이기도 했다.
<플로렌스 나이팅게일과 그녀의 콕스콤브 다이어그램. 1854년에서 1856년까지 크림 전쟁 당시 사망 원인을 보여주는 것이다.>
데이터의 시각화는 복잡한 데이터를 이용해 강력하고, 세련된 이미지를 만들어 내는 것이다. 마치 아름다운 산문과도 같다: 이를 통해 기쁨을 경험할 수 있으며, 한편으로 훌륭한 수단이지만, 유혹적이고 현혹적이 될 가능성도 있다.
우리는 시각적으로 표현된 것 보다 말로 표현된 데이터에 더 익숙하기 때문에, 시각화된 데이터를 순진하게 그냥 믿어버릴 수 있다. 데이터를 너무 많이 시각화하는 것은 통계를 현란하게 위장하는 것과 비슷하다:
인상적인 모양은 주목을 끌 수 있지만, 유용한 정보 전달에 실패하거나 우리를 적극적으로 엉뚱한 곳에 데려갈 수도 있다.
일례로, 뉴요커지에 나온 불평등에 대한 온라인 지하철 지도를 고려해 보자.
이 지도에서는 “뉴욕은 불평등으로 곤란을 겪고 있다”는 말을 하고 있다. 다양한 지하철 지도를 클릭하게 되고, 다양한 지하철 노선들을 따라 중간 소득의 피크와 그에 대한 생각을 보여주는 횡단면 그래프를 보게 된다.
결과는 훌륭하지만 지도가 보여줄 수 있는 것 보다는 정보 전달력이 떨어진다. 이것은 일종의 통계적 분석을 가장한 예술의 일종이다.
<불평등과 뉴욕 지하철. 출처: The New Yorker>
보다 유명한 예로는 데이비드 맥캔들스(David McCandless)의 애니메이션 “뎁트리스(Debtris)”가 있다.
여기서는 중독성 있는 컴퓨터 게임인 테트리스에 경의를 표하는 8비트 배경음악에 따라 큰 블록이 서서히 내려온다. 블록의 크기는 각자의 달러 가치를 나타낸다. “600억 달러: 2003년 이라크 전쟁 예상 비용”에 이어 “3조 달러: 이라크 전쟁 총 예상 비용”이 내려오고, 이어 월마트의 수입, UN 예산, 금융 위기 비용 등등이 이어진다.
이 애니메이션은 순전히 현란한 위장의 예이다. 통계상 사과는 모든 면에서 오렌지와 비유된다. 예를 들어, 이라크에 대한 대비는, 처음 있는 그대로 과거 중 하나와 현재를 대비시킨 것이 아니라, 미국 국방부가 과거 지출했을 것이라는 생각되는 금액 중 하나와 죽은 병사들의 목숨에 대한 금전적 가치 및 1조 달러가 넘는 “거시경제적 비용”을 포함하는 보다 넓은 예측 비용을 대비시킨 것이다.
이 전쟁은 재앙이었다. 그러한 사례를 보여주기 위해서는 아무런 통계적 유인 수단도 필요 없다.
정보는 아름다울 수 있다고 맥캔들스는 우리에게 말한다. 불행하게도, 잘못된 정보도 아름다울 수는 있다. 아니면, 통계학 전문가 마이클 블래스트랜드(Michael Blastland)가 말한 것 처럼, “우리는 우리가 항상 해왔던 것과 동일한 통계적 실수를 할 위험에 처해 있다. 오직 아름답게 보이기 위해.”
그런 아름다운 콕스콤브 다이아그램도 예외는 아니다. 이들은 크림 전쟁에서의 사망 원인을 보여주며, 보다 좋은 위생상태가 생명을 살렸다는 효과적인 사례를 보여주었다.
하지만, 나이팅게일의 전기 작가인 휴 스몰(Hugh Small)은, 그녀가 이 사례에 대한 정확한 의견을 진술하기 위해 콕스콤브 다이아그램을 선택했다고 주장한다.
오히려 간단한 막대 그래프가 더 명료할 수 있었다: 나이팅게일의 목적은 너무나 분명했다. 콕스콤브 다이아그램은 열악한 위생상태 만큼이나 겨울의 추위가 병사들을 죽음으로 몰고 갔다고 점을 명확히 보여주기 때문이다.
나이팅게일이 한 데이터 프레젠테이션은 교묘한 것이었다. 이는 또한 정보를 전달하기 위한 것이 아니라 설득을 위해 디자인된 것이었다. 우리가 현대의 데이터 시각화를 볼 때, 이 사실을 기억해야 할 것이다.
This page is synchronized from the post: ‘잘못된 정보도 아름다울 수 있다.’