우리는 데이터 기반 시대에 살고 있다. 구글(Google)의 전 CEO인 에릭 슈미트(Eric Schmidt)는 오늘날 이틀마다 생산되는 데이터의 양이 태초부터 2003년까지 생산된 양과 맞먹는다고 말했다. 이 모든 정보는 우리의 삶을 더 낫게 만들 힘이 있지만, 이 힘을 제대로 쓰려면 데이터 기반 세상을 명확히 사고하는 법을 배워야 한다. 명확한 사고는 어렵고, 특히 데이터와 데이터 분석을 둘러싼 온갖 기술적 세부 사항이 얽히면 더욱 그렇다.
데이터 기반 시대에 명확하게 사고하려면 무엇보다도 개념과 질문에 집중해야 한다. 세부 기법은 비록 중요하긴 하지만 어디까지나 개념과 질문을 뒷받침할 뿐이다. 안타깝게도 많은 사람이 데이터를 배우는 통계학이나 양적 추론 수업에서는 정반대로 기술적 세부 사항에 집중한다. 학생들은 수학 공식을 배우고 통계적 절차의 이름을 외우고 자신들이 무엇을, 왜 하는지 명확하게 생각해 볼 기회 없이 숫자만 주물럭거린다. 이런 접근 방식은 수학에 익숙한 사람들에겐 괜찮다. 그렇지만 대다수의 사람들에겐 역효과가 난다는 것이 우리 의견이다. 학생들이 세부 기법을 익히느라 생각하기를 멈추고 외우기 시작하면 나무만 보고 숲은 못 보게 된다. 게다가 재미도 없다.
우리는 이와 반대로 개념 이해에 집중하겠다. 여러분이 데이터를 분석할 때 세상의 어떤 특성을 비교하는가? 서로 다른 종류의 비교는 어떤 질문에 대답할 수 있는가? 풀고자 하는 문제에 맞는 질문과 비교 대상을 알고 있는가? 그럴듯하게 들리는 대답이 어째서 실제로는 방향이 잘못된 경우가 생길까? 좀더 유익한 답변을 얻으려면 어떤 창의적인 접근 방법을 쓸 수 있을까?
세부 기법이 중요하지 않다는 얘기가 아니다. 다만 개념 이해와 명확한 사고 없이 기술만 익히면 재앙을 부른다. 여러분이 일단 양적 분석에 관해 명확하게 사고하고, 일단 주의 깊고 정밀한 질문을 던지는 일이 왜 중요한지 이해한다면 분석 기술은 자연스럽게 따라온다. 게다가 이 편이 더 재미있다.
이런 점을 고려해서 데이터 분석, 통계학, 기타 정량적 방법론의 사전 지식 없이도 이 책을 읽을 수 있도록 썼다. 개념적 사고가 더 중요하기 때문에 되도록 일상 언어로 설명하고 기술 관련 내용을 (완전히 배제하지는 않았지만) 최소화했다. 이 책이 양적 분석을 고찰하고 실행하는 방법의 길잡이가 되길 바란다. 누구나 정량화된 정보의 세련된 소비자가 (심지어 생산자도) 될 수 있다고 믿는다. 단지 인내심, 끈기, 많은 노력, 세부 기법이 명확한 사고를 몰아내지 않도록 할 굳건한 의지가 있으면 된다.
데이터 분석 전문가가 되는 사람은 그리 많지 않다. 다만 여러분이 데이터 분석가든 아니든 이 책에서 배운 기술을 다양한 방식으로 활용할 것이라고 자신한다. 여러분 중에는 양적 분 석가를 고용했거나 그들과 협업하는 사람도 많을 것이다. 그리고 여러분 모두가 논문, 뉴스 기사, 업무 브리핑 등을 읽을 터이고, 이 글을 쓴 저자는 양적 분석을 활용해서 어떤 결론을 납득시키려고 할 것이다. 이 책은 올바른 질문을 던지고, 필요하다면 회의적으로 바라보고, 유용한 증거와 오도하는 증거를 구분하기에 필요한 명확한 사고 능력을 갖추게 해 줄 것이다.