모든 종류의 차트들 중 산점도(Scatter plot) 만큼 강력한 효과를 주는 차트는 없습니다. 표나 다른 유형의 차트에서는 알아채기가 거의 불가능한 관계를 이해할 수 있게 해 줍니다. 예를 들어, 아래 차트에서는 국가의 종교성과 부의 관계를 산점도로 나타낸 것입니다. 심리학자 마이클 프렌들리와 도표 사학자 다니엘 데니스는 산점도를 “통계 그래픽 역사상 가장 유용한 발명”이라고 말합니다.
하지만 이 유용한 차트가 언제 발명되었는지는 명확하지 않습니다.
산점도는 처음 분산형 그래프(scatter diagram)라고 불렸는데, 17세기 르네 데카르트가 개발한 수평선과 수직선이 두 축을 이룬 직교 좌표계 위에 점을 찍는 형식이었습니다. 대수학에서 사용하는 x 및 y를 사용해 수평축을 x-축으로, 수직축을 y-축이라고 부릅니다. 데카르트가 이 좌표계를 개발한 이유는 기하학과 대수학 사이의 관계를 나타내기 위해서였지만, 실제 사물들 간의 관계를 나타내는데 사용되리라고는 생각하지 못했을 것입니다.
막대, 선 및 파이 차트는 18세기 전환기에 스코틀랜드의 정치경제학자 윌리엄 플레이페어가 발명했습니다. 플레이페어 이들 차트를 이용해 재무 및 인구 통계 추세를 시각화했습니다. 당시만 해도 학술 정보를 시각화한다는 생각은 미숙한 것으로 여겨졌습니다. 놀라운 상상력과 배짱이 있어야 했습니다.
<윌리엄 플레이페어>
하지만 산점도는 플레이페어의 작품은 아니고, 그의 사후에 나왔습니다. 프렌들리와 데니스는 산점도의 기원과 역사를 다룬 글(http://datavis.ca/papers/friendly-scat.pdf)에서 플레이페어가 시간 경과에 따른 경제 데이터의 추세를 찾아내는데 관심이 없었다면 산점도도 탄생하지 못했을 거라고 말합니다. 예를 들어, 그는 밀 가격이 상승 추세인지 하락 추세인지, 또는 영국의 무역 적자가 늘어나고 있는지 알고 싶어 했습니다. 선 차트 또는 막대 차트는 그의 관심에 적당했습니다.
이와 반대로, 산점도는 과학자들에게 더 유용했습니다. 선 차트와 막대 차트가 신문과 기업의 프레젠테이션에서 훨씬 더 일반적으로 사용되는 반면, 산점도는 과학 잡지에서 지배적으로 사용되고 있습니다. 통계학자 에드워드 터프트에 따르면, 과학 간행물에 쓰인 모든 차트들 중 70% 이상이 산점도라고 합니다.
그렇기 때문에 산점도를 만들어낸 것은 과학자일 것이라는 추측이 타당성이 있습니다. 프렌들리와 데니스는 실질적인 증거는 없지만, 1833년 영국 과학자 존 프레드릭 W. 허쉘이 처음 산점도를 만들었다고 생각합니다.
<존 프레드릭 W. 허쉘>
허쉘은 두 별의 궤도를 연구하면서 작성한 연구 노트에 두 별의 위치 각도를 측정 연도별로 차트화할 수 있다고 적고 있습니다. 프렌들리는 “이 말이 선 차트를 그린다고 볼 수도 있지만, 변수 중 하나가 시간이라는 점을 감안할 때, 선 차트와는 다르다. 그가 데이터를 통해 추세를 추적하려고 한 것이 아니라, 두 측정치 사이의 기본적 관계를 이해하고 싶어 했기 때문이다. 역사 기술에서 어떤 것의 발전 과정에서 특정한 것이 최초의 사례라고 주장하는 것은 언제나 위험한 일이다.”라고 말합니다. 그럼에도 프렌들리는 허쉘이 최초로 산점도를 만들었을 것이라고 생각합니다.
과학 분야에서 산점도의 역할은 근대 통계학의 아버지 프랜시스 골턴 덕분이라고 해도 과언이 아닙니다. 골턴은 통계에서 상관관계라는 개념을 만든 이들 중 하나입니다. 그는 특히 유전학에 관심이 있었고, 상관관계 분석을 통해 부모와 자식의 키 사이의 관계를 이해하고자 했습니다. (또한 골턴은 악명 높은 우생학자이기도 했습니다). 이런 관계를 분석하는데 산점도가 완벽한 차트였고, 그는 1870년대와 1880년대에 산점도를 사용하기 시작했습니다. 비로소 산점도가 하나의 차트로서 자리 잡기 시작한 것입니다.
1세기가 지난 후 산점도는 다시 한 번 인기를 끌기 시작했습니다. 1980년대, 통계학자 윌리엄 클리블랜드와 로버트 맥길은 사람들이 가장 정확하고 가장 빠르게 인식하는 차트가 무엇인지에 대한 연구를 수행했습니다. 산점도가 바로 그런 차트였습니다. 사람들은 수많은 점으로 이루어진 차트를 보고 점들 간의 관계를 아주 능숙하게 이해했습니다.
데이터의 황금시대인 오늘날 산점도는 어디에서나 볼 수 있습니다. 우리가 산점도에 나타낸 내용을 완전히 이해할 수는 없다 해도, 세상에 대해 생각하는 방식을 바꿔놓은 것은 분명합니다. ,
<출처: Quartz, “A brief history of the scatter plot—data visualization’s greatest invention”>
This page is synchronized from the post: ‘산점도의 간략한 역사 - 데이터 시각화의 가장 위대한 발명’