요즘 빅데이터(Big Data), 데이터 과학자(Data Scientist) 에 대한 관심이 어느때보다 높은 듯 합니다. 데이터 과학자에 대한 자질, 역량에 대한 이야기도 많은데요, 많은 경우 분석 역량, 분석기법에 대한 지식에 대해서 할애를 하고 있습니다. 데이터 과학자라고 하는 사람이 데이터 처리도 못하고, 분석기법에 대해서도 모른다는 것은 마치 요리사가 칼을 잘 다루지도 못하고, 요리 레서피도 모른다는 것이기 때문에 이는 합당한 강조라고 하겠습니다.
반면에 데이터 분석의 처음 시작이라고 할 수 있는 '호기심', '(좋은) 질문하기', '데이터를 능동적으로 찾고 수집하고 조합해보기', '상식과 통념을 의심해보고 도전해보기', '일상의 실생활 속에서 데이터로 생각해보기' 등에 대해서는 상대적으로 관심이 덜 한 듯 합니다.
위 전자(분석기법)를 잘하는 데이터 과학자는 현업이 주는 요건에 대해서 분석만 해주는 수동적 분석대행자로 전락할 위험이 있는 반면, 후자(호기심, 질문)까지 겸비한 데이터 과학자는 데이터 속에 숨겨진 현업이 몰랐던 숨겨진 패턴과 인사이트까지 찾아낼 가능성이 더 높다고 생각합니다. 분석에 임하는 즐거움, 행복지수도 역시 후자가 더 높을 것이라고 보구요.
오늘 리뷰할 책 '괴짜경제학 (FREAKONOMICS)'은 바로 이 후자에 대한 모범사례가 되겠습니다. (네이트 실버의 '신호와 소음 (The Signal and The Noise)'도 모범사례로 추천)
책의 표지를 보면 '겉은 사과인데 속을 칼로 썰어서 실제 확인해 보니 귤'인 사진이 나오지요? 상식과 통념이라는 겉(사과)에 현혹이 되면 실제의 본질(귤)을 못본다는 은유가 되겠습니다.
책의 저자는 두명이예요. 스티븐 레빗은 시카고 대학교 경제학자이고 스티븐 더브너는 뉴욕타임스 기자예요.
* 사진출처: '괴짜경제학' 책 표지 | * 사진출처: '괴짜경제학' 책 표지 |
경제학자 스티븐 레빗이 말하는 경제학에 대한 생각을 들어보면 '괴짜경제학'이라는 신종 용어가 왜 생겼는지 조금 이해가 될 것 같습니다.
p7. 레빗의 견해에 따르면, 경제학은 해답을 얻는데 유용한 도구들을 보유하고 있는 반면, 흥미로운 질문은 심각할 정도로 부족한 학문이다. 레빗이 지닌 특수한 재능은 바로 그러한 질문을 던지는 능력이다.
레빗은 경제학에서 데이터를 가지고 해답을 얻는 도구를 가져다가, 레빗의 '흥미로운 질문 던지는' 특기를 더해 경제학 비전공자가 읽기에도 재미있는 이야기를 풀어갑니다. 상식과 통념뿐만 아니라 '이래야 한다'는 '윤리'도 뛰어넘어 '실제'에 불편한 직면을 하게 만들기도 합니다.
p30. 윤리학이 우리가 원하는 이상적인 세상을 대표한다면 경제학은 실제로 존재하는 현실적인 세상을 의미한다. 경제학은 측정을 목적으로 하는 모든 학문의 상위에 위치하며, 두서없이 복잡하게 얽혀 있는 정보를 신뢰성 높게 평가할 수 있는 강력하고 융통성 있는 도구로 구성되어 있어, 한 요인이 미친 영향 혹은 전체적인 결과를 결정할 수 있다. ...
p31. 이 책의 목적은 모든 것, 그렇다, 모든 것의 숨겨진 이면을 파헤치는 것이다. ... 우리는 경제학이 보유한 가장 분석적인 도구들을 사용하여 누구의 머릿속에나 떠오를 수 있는 호기심 어린 질문을 따라가는 길을 택했다. 우리가 발명한 이 새로운 학문 분야는 '괴짜경제학(Freaknomics)'이라고 한다.
이 책에서 레빗이 던지는 질문들을 예로 들어보면 이런 것들 이예요.
- 교사와 스모 선수의 공통점은?
- KKK와 부동산 중개업자는 어떤 부분이 닮았을까?
- 마약 판매상은 왜 어머니와 함께 사는 걸까?
- 그 많던 범죄자들은 다 어디로 갔을까?
- 완벽한 부모는 어떻게 만들어지는가?
- 부모는 아이에게 과연 영향을 미치는가?
레빗은 이런 괴짜(?) 질문을 던지고 여기서 끝나는 것이 아니라, 데이터를 가지고 분석을 해서 가설을 검증한다는 점이 일반인과 다른 점이 되겠습니다.
저자는 이 책이 '책 전체를 관통하는 일관된 하나의 주제는 없다'고 말하고 있습니다만, 경제학에서 중요하게 생각하는 '보상'이라는 개념을 여기저기서 차용해서 활용하고 있습니다.
p36. 경제학은 근본적으로 인센티브를 연구하는 학문이다. 사람들은 어떻게 자신이 원하거나 필요로 하는 것을 얻는가? 특히 다른 이들이 같은 것을 원하고 있을 때 말이다. 경제학자들은 인센티브를 사랑한다. ... 인센티브는 총탄이며 지렛대이자 열쇠다. 즉 상황을 극적으로 바꿀 수 있는 놀라운 힘을 지닌 자그마한 어떤 것이다.
이 책 말고 인센티브, 행동경제학 관련 다른 책들에서도 본 적이 있는 사례인데요, 이스라엘 어린이집의 학부모들을 대상으로 '아이들을 늦게 데리러 오면 벌금을 부과하는 실험'을 했던 사례가 참 인상깊게 남습니다.
p40~41. 그러나 이 벌금 제도에는 또 다른 심각한 문제가 있었다. 도덕적 인센티브(지각한 부모들이 느껴야 하는 죄책감)을 경제적 인센티브(3달러의 벌금)로 대체한 것이 문제였다. 겨우 하루 몇 달러의 돈으로, 이제 부모들은 죄책감을 정당화할 수 있게 되었다. 나아가 적은 액수의 벌금은 부모들에게 지각이 그 정도의 가치밖에 안 된다는 생각을 품게 만들었다. 아무리 지각을 해봤자 놀이방이 손해 보는 정도가 겨우 3달러라면 굳이 테니스 시합을 서둘러 마치고 아이를 데리러 갈 필요가 없지 않은가? 실제로 실험 17주째에 경제학자들이 벌금 제도의 시행을 중단했는데도, 지각하는 부모들의 수에는 변화가 없었다. 이제 그들은 지각을 할 뿐만 아니라 벌금을 내지도 않았으며, 무엇보다도 더 이상 죄책감을 느끼지 않았다.
이는 인센티브의 강력하면서도 교묘한 특성이다. 단 하나의 아주 작고 미묘한 변화가 거대하고 극적인, 그리고 대개는 미리 예측하지 못했던 결과를 낳는다. 토머스 제퍼슨은 보스턴 차 사건의 발단이 된 조그마한 인센티브가 결국에는 미국 독립전쟁을 이끌어낸 데 주목하여 이러한 사실을 깨달았다. "이 세상을 지배하는 인과관계는 참으로 불가사의하다. 차에 부과된 겨우 2페니의 세금이, 비록 부당하게 매겨졌다고는 하나, 이 대륙에 사는 모든 이의 삶을 완전히 바꾸어버렸으니 말이다."
위의 사례는 실험을 통한 사례였다면 아래 소개하는 사례는 방대하게 쌓인 데이터를 분석해서 '교사와 스모선수의 공통점'을 찾아낸 사례가 되겠습니다. 학생들의 성적이 교사의 처우에 연계되게끔 한 인센티브에 반응해서 교사들이 학생들의 성적을 좋게 만들기 위해 부정행위를 한 것(스모선수가 인센티브에 반응해서 시합을 모의한 것처럼...)을 데이터를 가지고 밝혀낸 사례예요.
p47~48. 경제학은 근본적으로 인센티브와 관련된 학문인 동시에, 아주 다행스럽게도 사람들이 어떻게 그런 인센티브에 반응하는가를 측정하는 통계적 도구를 지닌 과학이기도 하다. 당신에게 필요한 것은 '약간의' 데이터, 그뿐이다. ...
부정행위를 저지르는 교사의 학급은 어떤 모습을 하고 있을까? 먼저 찾아야 할 것은 '희귀한' 답안 패턴이다. ... 이런 식으로 시카고 공립학교들의 모든 데이터를 분석해보면 연간 200개 이상의 학급에서 부정행위가 저질러진다는 증거를 발견할 수 있다. 전체의 5%에 가까운 수치다.
실제로 부정행위 의심교사의 학급(실험군)과 건전한 교사의 학급(대조군)을 뽑아서 재시험을 치루었고, 부정행위 의심에 대해 가설을 검증/실증하여 증거가 확고한 12명의 교사는 해고, 다른 많은 교사에게는 경고 조치가 취해졌다. 그리고 다음해, 교사들에 의한 부정행위는 30% 이상 줄었다고 한다.
이 책의 저자가 그렇다고 현란한 고급 통계분석 기법, 데이터 마이닝 기법을 사용했나 하면 그렇지도 않습니다. 대부분의 경우 실험군/대조군을 설정하는 실험설계의 기본적인 개념을 적용해서 통제변수를 통제하고 원하는 변수에 대해 영향력을 평가 (유의미한 차이가 있는 것인지 검증)하는, 통계학의 가장 기본적인 분석을 주로 수행했습니다. "완벽한 부모는 어떻게 만들어지는가?", "부모는 아이에게 과연 영향을 미치는가?" 파트에서는 '회귀분석' 기법을 이용했는데요, 이 또한 통계학을 배우는 분이라면 다변량분석 중에서도 제일 많이 배우는 기법이기도 하지요.
이는 우리가 분석기법을 몰라서 분석적 사고, 분석을 통한 검증을 못하겠다고 말하는게 실은, 호기심이 없고, 제대로된 질문을 못던지고, 데이터를 찾아나서고 모으고 분석하기에는 게을러서 그런 것은 아닌지 자문해보게 하는 대목입니다.
다만 저자가 하버드, MIT, 시카고 대학교에 몸 담고 있었고 네트워킹이 빠방하기 때문에 일반인이 접근하기 힘든 다양한 데이터에 접근할 수 있었던 점은 일반인과는 차별화된 저자만의 강점이기는 하겠습니다.
마지막으로 "그 많던 범죄자들은 다 어디로 갔을까?"에 대한 저자의 질문에 대한 답변을 소개하는 것으로 글을 마칠까 합니다. 많은 범죄학자, 경찰관, 경제학자, 정치가 등이 아래와 같은 다양한 가설을 제시했습니다. 가령, 혁신적 치안 정책, 징역형의 증가, 크랙을 비롯한 마약시장의 변화, 인구 고령화, 강력한 총기 규제 정책, 건실한 경제, 경찰 인원의 증가, 사형 구형의 증가, 은밀한 무기 소지 허용법, 총기류 유상회수 등....
저자가 데이터를 가지고 분석을 해보니 이들 가설 중에서 '사형 구형', '경제 호황', '총기 규제', '마약시장 변화' 등은 범죄율 감소와 연관이 거의 없었다고 합니다. 반면 '혁신적 치안 정책', '경찰 인원의 증가'는 어느 정도 연관이 있다고 하네요. 그리고 저자가 위의 가설에는 없는 새로운 가설을 들고 나와 데이터로 검증을 하였습니다. 바로 1960대 "낙태 합법화"가 가장 결정적인 범죄 감소 유발요인이라는 것입니다. 이러한 주장은 정치계, 종교계, 학계에서 거대한 논쟁을 일으켰습니다.
15~20여년 전에 '깨진 유리창의 법칙'이라는 책이 한 때 유행했었구요, 그 책의 초반에 '뉴욕 경찰청'이 '깨진 유리창의 법칙'을 차용해 노상방뇨나 무임지하철승차와 같은 '경범죄'(깨진 유리창)를 강력단속하여 살인, 방화, 강도 등의 '중범죄'를 예방하는 혁혁한 성과를 거두었다는 사례가 나옵니다. 괴짜경제학의 레빗은 이 '깨진 유리창의 법칙'에 나오는 뉴욕 경찰청 사례가 경찰 청장의 '깨진 유리창의 법칙' 차용 덕분이 아니라 실제는 20여년 전에 미국 대법원이 '낙태 합법화'를 했기 때문이라고 말하고 있습니다. 뉴욕뿐만이 아니라 다른 도시에서도 1990년대에는 범죄율이 동반 급락했다는게 그 증거입니다. '깨진 유리창의 법칙' 저자와 뉴욕 경찰청장은 '괴짜경제학' 책과 저자 '스티븐 레빗'을 정말로 싫어할 것 같습니다. ㅋㅋ
'책이랑 영화랑' 카테고리의 다른 글
[책] "착각하는 CEO" (유정식 저) 를 읽고, 사람에 대해 제대로 알고 경영하기를 원하는 이에게 (0) | 2015.09.12 |
---|---|
[책] 신호와 소음(The Signal and The Noise by Nate Silver), 빅데이터 시대 소음속에서 신호 찾기를 원하는 이에게! (0) | 2015.09.05 |
[책] 『프로페셔널 CEO』(by 해럴드 제닌)을 읽고서 (0) | 2015.08.04 |
[책] 『전략의 탄생 (Art of Strategy by Avinash K. Dixit) 』를 읽고 (2) | 2015.08.02 |
[책]『창의성에 관한 11가지 생각』을 읽고서 (2) | 2015.08.01 |