언론사 기자들이 조국 법무부장관 가족에 대해서 무책임하고 무차별적으로 '아니면 말고' 식의, 더 나아가서는 '악의적으로' 뭔가 잘못한게 있는 것처럼 사람들이 인식하게끔 기사를 내는 것이 너무 화가 납니다. 


OhmyNews에 현역 20년 경력의 교사께서 기고하신 글 일독을 권합니다. 

==> [조국을 위한 변명? 20년 경력 교사가 보는 조국 사태 "기자들, 욕 먹을 만하다. 적어도 교육 관련은..." (OhmyNews, 2019.09.10, 김행수 기자)] 


지지난주에 '조국 법무부장관 후보에 대한 최근 한달 뉴스 건수 비교로 본 언론의 광기 (2019.07.27~2019.08.26)' 라는 제목의 글을 썼었습니다.  그리고 지난주에는 '네이버(Naver)에서 조국 법무부장관 후보자에 대한 뉴스기사 건수가 줄어들었습니다.' 라는 제목으로 간단하게 포스팅하기도 했구요. 


이번 포스팅에서는 네이버에서 뉴스를 크롤링해서 (1) 날짜별 '조국 법무부' 키워드 뉴스 건수, (2) 언론사별 '조국 법무부' 키워드 뉴스 건수에 대해서 분석해보았습니다. 어제 자정에 걸어놓고 잤는데 오늘 새벽 4시쯤 한달치 뉴스 기사 크롤링 끝났네요. 



(1) 날짜별 '조국 법무부' 키워드 뉴스 건수 (2019.08.09 ~ 2019.09.09) : 54,111건



네이버에서 뉴스 크롤링할 때 사용한 검색 조건은 아래와 같습니다. 

  • 키워드 : '조국 법무부'
  • 기간 : 2019.08.09 ~09.09 (조국 법무부장관 후보 지명일 ~ 법무부장관 임명일까지)
  • 영역 : 전체
  • 언론사 : 전체
  • 유형 : 전체


크롤링은 '날짜', '언론사', '제목', '내용 (일부만)', '웹주소'를 가져왔으며, 이때 '날짜', '언론사', '제목'이 같으면 중복으로 간주하고 제거하였습니다. (약 1만5천건 제거됨)  



년월일

뉴스 건수

2019.08.09.

     1,250

2019.08.10.

       204

2019.08.11.

       212

2019.08.12.

       565

2019.08.13.

       428

2019.08.14.

       476

2019.08.15.

       230

2019.08.16.

       569

2019.08.17.

       161

2019.08.18.

       391

2019.08.19.

     1,442

2019.08.20.

     1,656

2019.08.21.

     2,269

2019.08.22.

     2,404

2019.08.23.

     2,623

2019.08.24.

       641

2019.08.25.

     1,225

2019.08.26.

     2,648

2019.08.27.

     2,823

2019.08.28.

     2,500

2019.08.29.

     2,120

2019.08.30.

     2,048

2019.08.31.

       681

2019.09.01.

     1,278

2019.09.02.

     3,614

2019.09.03.

     3,245

2019.09.04.

     3,067

2019.09.05.

     3,284

2019.09.06.

     3,634

2019.09.07.

     1,365

2019.09.08.

     1,447

2019.09.09.

     3,611





(2) 언론사별 '조국 법무부' 키워드 뉴스 건수


총 521개 언론사가 최근 한달 간 '조국 법무부' 키워드가 들어간 뉴스를 생산하였습니다.


아래의 그래프에서 확인할 수 있는 바와 같이, 최근 한달간 '조국 법무부' 키워드가 들어간 뉴스를 생산한 언론사의 상위 1% (5개 사)가 뉴스건수의 18%, 상위 10%(52개 사)가 뉴스건수의 60%, 상위 20%(104개 사)가 뉴스건수의 80%를 차지하고 있습니다. (2:8 파레토법칙이 정확하게 맞아떨어짐) 





* 아래에 보면 언론사 이름에 '언론사 선정'이라고 붙어있는 부분은 크롤링할 때 잘 처리가 안된건데요, 글 다 써놓고 놨더니 눈에 보이네요. ㅜ_ㅜ 일단 대세 파악하는데는 지장이 없으므로 이대로... ㅠ_ㅠ


언론사

번호

누적

언론사비율

 뉴스건수 

뉴스건수

비율

누적

뉴스건수 비율

뉴스1 1 0.2%       3,483 6.4% 6.4%
연합뉴스 2 0.4%       2,187 4.0% 10.5%
뉴시스 3 0.6%       2,032 3.8% 14.2%
머니투데이 4 0.8%       1,129 2.1% 16.3%
뉴스핌 5 1.0%       1,083 2.0% 18.3%
YTN 6 1.2%       1,058 2.0% 20.3%
이데일리 7 1.3%          841 1.6% 21.8%
중앙일보 8 1.5%          744 1.4% 23.2%
아주경제 9 1.7%          719 1.3% 24.5%
아시아경제 10 1.9%          713 1.3% 25.9%
KBS 11 2.1%          701 1.3% 27.1%
쿠키뉴스 12 2.3%          628 1.2% 28.3%
세계일보 13 2.5%          615 1.1% 29.4%
헤럴드경제 14 2.7%          611 1.1% 30.6%
노컷뉴스 15 2.9%          607 1.1% 31.7%
천지일보 16 3.1%          607 1.1% 32.8%

한국경제

17 3.3%          584 1.1% 33.9%
아시아투데이 18 3.5%          563 1.0% 34.9%
SBS 19 3.6%          559 1.0% 36.0%
국민일보 20 3.8%          549 1.0% 37.0%
민중의소리 21 4.0%          526 1.0% 38.0%
데일리안 22 4.2%          497 0.9% 38.9%

세계일보

23 4.4%          496 0.9% 39.8%
MBC 24 4.6%          495 0.9% 40.7%

서울경제

25 4.8%          467 0.9% 41.6%
MBN 26 5.0%          460 0.9% 42.4%

서울신문

27 5.2%          456 0.8% 43.3%
조선일보 28 5.4%          439 0.8% 44.1%
중앙일보언론사 선정 29 5.6%          431 0.8% 44.9%
뉴데일리 30 5.8%          426 0.8% 45.7%
연합뉴스언론사 선정 31 6.0%          422 0.8% 46.4%
매일경제 32 6.1%          418 0.8% 47.2%
머니S 33 6.3%          417 0.8% 48.0%
경향신문 34 6.5%          403 0.7% 48.7%
아시아경제언론사 선정 35 6.7%          396 0.7% 49.5%
뷰스앤뉴스 36 6.9%          393 0.7% 50.2%
한국일보언론사 선정 37 7.1%          390 0.7% 50.9%
조선일보언론사 선정 38 7.3%          381 0.7% 51.6%
tbs 교통방송 39 7.5%          380 0.7% 52.3%
파이낸셜뉴스 40 7.7%          367 0.7% 53.0%
서울경제 41 7.9%          365 0.7% 53.7%
한국경제 42 8.1%          363 0.7% 54.3%
동아일보언론사 선정 43 8.3%          358 0.7% 55.0%
부산일보 44 8.4%          351 0.6% 55.6%
연합뉴스TV 45 8.6%          347 0.6% 56.3%
뉴스1언론사 선정 46 8.8%          327 0.6% 56.9%
이투데이 47 9.0%          315 0.6% 57.5%
국민일보언론사 선정 48 9.2%          301 0.6% 58.0%
폴리뉴스 49 9.4%          297 0.5% 58.6%
경향신문언론사 선정 50 9.6%          297 0.5% 59.1%
뉴스웨이 51 9.8%          294 0.5% 59.7%
머니투데이언론사 선정 52 10.0%          293 0.5% 60.2%
경인일보 53 10.2%          292 0.5% 60.8%
매일신문 54 10.4%          285 0.5% 61.3%
국제신문 55 10.6%          281 0.5% 61.8%
동아일보 56 10.7%          277 0.5% 62.3%
UPI뉴스 57 10.9%          275 0.5% 62.8%
YTN언론사 선정 58 11.1%          273 0.5% 63.3%
파이낸셜뉴스언론사 선정 59 11.3%          272 0.5% 63.8%
한국일보 60 11.5%          271 0.5% 64.3%
글로벌이코노믹 61 11.7%          270 0.5% 64.8%
이데일리언론사 선정 62 11.9%          268 0.5% 65.3%
브릿지경제 63 12.1%          266 0.5% 65.8%
매일경제언론사 선정 64 12.3%          265 0.5% 66.3%
시사포커스 65 12.5%          264 0.5% 66.8%
노컷뉴스언론사 선정 66 12.7%          262 0.5% 67.3%
더팩트 67 12.9%          251 0.5% 67.7%
디지털타임스 68 13.1%          245 0.5% 68.2%
OBS 69 13.2%          225 0.4% 68.6%
일요서울 70 13.4%          225 0.4% 69.0%
뉴스토마토 71 13.6%          224 0.4% 69.4%
뉴시스언론사 선정 72 13.8%          209 0.4% 69.8%
BBS NEWS 73 14.0%          205 0.4% 70.2%
헤럴드경제언론사 선정 74 14.2%          204 0.4% 70.6%
TV조선 75 14.4%          204 0.4% 71.0%
문화일보 76 14.6%          203 0.4% 71.3%
서울신문 77 14.8%          203 0.4% 71.7%
한겨레 78 15.0%          198 0.4% 72.1%
채널A언론사 선정 79 15.2%          192 0.4% 72.4%
파이낸스투데이 80 15.4%          189 0.3% 72.8%
연합뉴스TV언론사 선정 81 15.5%          188 0.3% 73.1%
MBN언론사 선정 82 15.7%          187 0.3% 73.5%
SBS언론사 선정 83 15.9%          180 0.3% 73.8%
대구신문 84 16.1%          170 0.3% 74.1%
한겨레언론사 선정 85 16.3%          168 0.3% 74.4%
매일일보 86 16.5%          166 0.3% 74.7%
아시아뉴스통신 87 16.7%          165 0.3% 75.0%
브레이크뉴스 88 16.9%          162 0.3% 75.3%
충청리뷰 89 17.1%          161 0.3% 75.6%
오마이뉴스 90 17.3%          160 0.3% 75.9%
스페셜경제 91 17.5%          156 0.3% 76.2%
KBS언론사 선정 92 17.7%          156 0.3% 76.5%
뉴스웍스 93 17.9%          155 0.3% 76.8%
국제뉴스 94 18.0%          155 0.3% 77.1%
MBC언론사 선정 95 18.2%          152 0.3% 77.4%
아이뉴스24 96 18.4%          150 0.3% 77.6%
금강일보 97 18.6%          149 0.3% 77.9%
한강타임즈 98 18.8%          149 0.3% 78.2%
디지털타임스언론사 선정 99 19.0%          148 0.3% 78.5%
프레시안언론사 선정 100 19.2%          148 0.3% 78.7%
일요신문 101 19.4%          147 0.3% 79.0%
TV조선언론사 선정 102 19.6%          144 0.3% 79.3%
톱스타뉴스 103 19.8%          143 0.3% 79.5%
위키트리 104 20.0%          140 0.3% 79.8%
미디어펜 105 20.2%          139 0.3% 80.1%
중부일보 106 20.3%          139 0.3% 80.3%
데일리한국 107 20.5%          135 0.2% 80.6%
신아일보 108 20.7%          134 0.2% 80.8%
공감신문 109 20.9%          134 0.2% 81.1%
영남일보 110 21.1%          131 0.2% 81.3%
데일리안언론사 선정 111 21.3%          130 0.2% 81.5%
시사위크 112 21.5%          124 0.2% 81.8%
싱글리스트 113 21.7%          124 0.2% 82.0%
JTBC언론사 선정 114 21.9%          124 0.2% 82.2%
오마이뉴스언론사 선정 115 22.1%          123 0.2% 82.5%
뉴스인사이드 116 22.3%          119 0.2% 82.7%
일요시사 117 22.5%          117 0.2% 82.9%
미디어오늘언론사 선정 118 22.6%          117 0.2% 83.1%
아시아타임즈 119 22.8%          117 0.2% 83.3%
시사저널 120 23.0%          117 0.2% 83.5%
JTBC 121 23.2%          116 0.2% 83.8%
비즈니스포스트 122 23.4%          113 0.2% 84.0%
뉴스프리존 123 23.6%          111 0.2% 84.2%
팩트TV 124 23.8%          108 0.2% 84.4%
메트로신문 125 24.0%          107 0.2% 84.6%
스카이데일리 126 24.2%          105 0.2% 84.8%
에너지경제 127 24.4%            98 0.2% 84.9%
월간조선 128 24.6%            96 0.2% 85.1%
채널A 129 24.8%            95 0.2% 85.3%
내일신문 130 25.0%            95 0.2% 85.5%
한국정경신문 131 25.1%            94 0.2% 85.6%
시사오늘 132 25.3%            92 0.2% 85.8%
한국경제TV 133 25.5%            91 0.2% 86.0%
글로벌경제 134 25.7%            88 0.2% 86.1%
고발뉴스 135 25.9%            87 0.2% 86.3%
조세일보 136 26.1%            86 0.2% 86.5%
중도일보 137 26.3%            84 0.2% 86.6%
시사매거진 138 26.5%            83 0.2% 86.8%
녹색경제신문 139 26.7%            83 0.2% 86.9%
청년일보 140 26.9%            82 0.2% 87.1%
자유한국당 141 27.1%            80 0.1% 87.2%
시선뉴스 142 27.3%            80 0.1% 87.4%
경기일보 143 27.4%            80 0.1% 87.5%
경북매일신문 144 27.6%            79 0.1% 87.7%
더불어민주당 145 27.8%            77 0.1% 87.8%
서울와이어 146 28.0%            77 0.1% 87.9%
한국스포츠경제 147 28.2%            76 0.1% 88.1%
일간투데이 148 28.4%            75 0.1% 88.2%
뉴스타운 149 28.6%            72 0.1% 88.4%
기호일보 150 28.8%            72 0.1% 88.5%
문화일보언론사 선정 151 29.0%            71 0.1% 88.6%
전자신문 152 29.2%            70 0.1% 88.8%
시민일보 153 29.4%            70 0.1% 88.9%
대전일보 154 29.6%            70 0.1% 89.0%
문화저널21 155 29.8%            70 0.1% 89.1%
허프포스트코리아 156 29.9%            69 0.1% 89.3%
더리더 157 30.1%            68 0.1% 89.4%
아시아엔 158 30.3%            68 0.1% 89.5%
미디어스 159 30.5%            68 0.1% 89.6%
대구일보 160 30.7%            67 0.1% 89.8%
전남일보 161 30.9%            64 0.1% 89.9%
바른미래당 162 31.1%            64 0.1% 90.0%
아이뉴스24언론사 선정 163 31.3%            61 0.1% 90.1%
경상매일신문 164 31.5%            59 0.1% 90.2%
에듀인뉴스 165 31.7%            58 0.1% 90.3%
경북일보 166 31.9%            57 0.1% 90.4%
프라임경제 167 32.1%            52 0.1% 90.5%
전북일보 168 32.2%            52 0.1% 90.6%
월요신문 169 32.4%            52 0.1% 90.7%
이코노뉴스 170 32.6%            51 0.1% 90.8%
법률방송뉴스 171 32.8%            51 0.1% 90.9%
YTN라디오 172 33.0%            51 0.1% 91.0%
인사이트 173 33.2%            51 0.1% 91.1%
부산일보언론사 선정 174 33.4%            51 0.1% 91.2%
시사저널이코노미 175 33.6%            50 0.1% 91.3%
시빅뉴스 176 33.8%            50 0.1% 91.4%
뉴스한국 177 34.0%            50 0.1% 91.5%
이코리아 178 34.2%            50 0.1% 91.6%
충남일보 179 34.4%            49 0.1% 91.7%
SBS CNBC 180 34.5%            49 0.1% 91.8%
스트레이트뉴스 181 34.7%            49 0.1% 91.8%
새전북신문 182 34.9%            49 0.1% 91.9%
인천일보 183 35.1%            48 0.1% 92.0%
경북신문 184 35.3%            48 0.1% 92.1%
베타뉴스 185 35.5%            48 0.1% 92.2%
직썰 186 35.7%            46 0.1% 92.3%
CNB뉴스 187 35.9%            46 0.1% 92.4%
EBN 188 36.1%            46 0.1% 92.5%
법률신문 189 36.3%            46 0.1% 92.5%
무등일보 190 36.5%            45 0.1% 92.6%
뉴스렙 191 36.7%            45 0.1% 92.7%
위키리크스한국 192 36.9%            44 0.1% 92.8%
경남신문 193 37.0%            44 0.1% 92.9%
업다운뉴스 194 37.2%            42 0.1% 92.9%
한국대학신문 195 37.4%            42 0.1% 93.0%
업코리아 196 37.6%            42 0.1% 93.1%
경기신문 197 37.8%            41 0.1% 93.2%
경상일보 198 38.0%            41 0.1% 93.3%
이뉴스투데이 199 38.2%            41 0.1% 93.3%
내외뉴스통신 200 38.4%            41 0.1% 93.4%
문화뉴스 201 38.6%            41 0.1% 93.5%
경남일보 202 38.8%            40 0.1% 93.6%
강원도민일보 203 39.0%            40 0.1% 93.6%
데일리그리드 204 39.2%            40 0.1% 93.7%
매일신문언론사 선정 205 39.3%            40 0.1% 93.8%
포쓰저널 206 39.5%            39 0.1% 93.8%
공공뉴스 207 39.7%            39 0.1% 93.9%
충청일보 208 39.9%            38 0.1% 94.0%
금융소비자뉴스 209 40.1%            38 0.1% 94.1%
디트뉴스24 210 40.3%            37 0.1% 94.1%
스포츠경향 211 40.5%            37 0.1% 94.2%
경남매일신문 212 40.7%            37 0.1% 94.3%
EBS 213 40.9%            37 0.1% 94.3%
로이슈 214 41.1%            37 0.1% 94.4%
남도일보 215 41.3%            36 0.1% 94.5%
중앙SUNDAY 216 41.5%            35 0.1% 94.5%
투데이신문 217 41.7%            34 0.1% 94.6%
조선비즈언론사 선정 218 41.8%            34 0.1% 94.7%
한국경제TV언론사 선정 219 42.0%            33 0.1% 94.7%
뷰어스 220 42.2%            33 0.1% 94.8%
정의당 221 42.4%            33 0.1% 94.8%
내외경제tv 222 42.6%            33 0.1% 94.9%
투데이코리아 223 42.8%            32 0.1% 95.0%
충청투데이 224 43.0%            32 0.1% 95.0%
울산종합일보 225 43.2%            32 0.1% 95.1%
대경일보 226 43.4%            32 0.1% 95.1%
전북도민일보 227 43.6%            32 0.1% 95.2%
MTN 228 43.8%            32 0.1% 95.3%
강원일보 229 44.0%            32 0.1% 95.3%
데일리메디 230 44.1%            31 0.1% 95.4%
경북도민일보 231 44.3%            31 0.1% 95.4%
프레시안 232 44.5%            31 0.1% 95.5%
경남도민신문 233 44.7%            31 0.1% 95.5%
스포츠조선 234 44.9%            30 0.1% 95.6%
우리공화당 235 45.1%            30 0.1% 95.7%
전라일보 236 45.3%            30 0.1% 95.7%
오가닉라이프신문 237 45.5%            29 0.1% 95.8%
충청매일 238 45.7%            29 0.1% 95.8%
뉴스브라이트 239 45.9%            28 0.1% 95.9%
한라일보 240 46.1%            28 0.1% 95.9%
부산MBC 241 46.3%            28 0.1% 96.0%
민주신문 242 46.4%            28 0.1% 96.0%
서울파이낸스 243 46.6%            28 0.1% 96.1%
뉴스포스트 244 46.8%            26 0.0% 96.1%
뉴스워치 245 47.0%            26 0.0% 96.2%
뉴스투데이 246 47.2%            26 0.0% 96.2%
청년의사 247 47.4%            26 0.0% 96.3%
레디앙 248 47.6%            26 0.0% 96.3%
민주평화당 249 47.8%            25 0.0% 96.4%
코리아중앙데일리 250 48.0%            25 0.0% 96.4%
대전투데이 251 48.2%            25 0.0% 96.5%
제민일보 252 48.4%            25 0.0% 96.5%
스포츠서울 253 48.6%            24 0.0% 96.5%
Queen 254 48.8%            24 0.0% 96.6%
화이트페이퍼 255 48.9%            24 0.0% 96.6%
경기방송 256 49.1%            24 0.0% 96.7%
비즈트리뷴 257 49.3%            23 0.0% 96.7%
경남도민일보 258 49.5%            23 0.0% 96.8%
조세금융신문 259 49.7%            22 0.0% 96.8%
M이코노미 260 49.9%            22 0.0% 96.8%
한국금융신문 261 50.1%            22 0.0% 96.9%
광남일보 262 50.3%            21 0.0% 96.9%
울산매일신문 263 50.5%            21 0.0% 97.0%
컨슈머타임스 264 50.7%            21 0.0% 97.0%
더셀럽 265 50.9%            21 0.0% 97.0%
의협신문 266 51.1%            20 0.0% 97.1%
마이데일리 267 51.2%            20 0.0% 97.1%
시민의소리 268 51.4%            20 0.0% 97.2%
충북일보 269 51.6%            20 0.0% 97.2%
SBS CNBC언론사 선정 270 51.8%            20 0.0% 97.2%
메디게이트뉴스 271 52.0%            20 0.0% 97.3%
가톨릭평화방송·평화신문 272 52.2%            20 0.0% 97.3%
중부매일 273 52.4%            20 0.0% 97.3%
전민일보 274 52.6%            20 0.0% 97.4%
티브이데일리 275 52.8%            19 0.0% 97.4%
크리스천투데이 276 53.0%            19 0.0% 97.4%
KNN 277 53.2%            19 0.0% 97.5%
전북중앙 278 53.4%            19 0.0% 97.5%
굿모닝충청 279 53.6%            19 0.0% 97.5%
SR타임스 280 53.7%            18 0.0% 97.6%
서울경제TV 281 53.9%            18 0.0% 97.6%
광주매일신문 282 54.1%            18 0.0% 97.6%
더드라이브 283 54.3%            18 0.0% 97.7%
강원일보언론사 선정 284 54.5%            18 0.0% 97.7%
충청타임즈 285 54.7%            17 0.0% 97.7%
뉴스워커 286 54.9%            17 0.0% 97.8%
당진신문 287 55.1%            17 0.0% 97.8%
여성신문 288 55.3%            17 0.0% 97.8%
ifspost 289 55.5%            16 0.0% 97.9%
베리타스알파 290 55.7%            16 0.0% 97.9%
KTV국민방송 291 55.9%            15 0.0% 97.9%
매일노동뉴스 292 56.0%            15 0.0% 98.0%
라포르시안 293 56.2%            15 0.0% 98.0%
메디파나뉴스 294 56.4%            15 0.0% 98.0%
연합인포맥스 295 56.6%            15 0.0% 98.0%
sbn뉴스 296 56.8%            15 0.0% 98.1%
메디칼타임즈 297 57.0%            14 0.0% 98.1%
엑스포츠뉴스 298 57.2%            14 0.0% 98.1%
IT조선 299 57.4%            14 0.0% 98.1%
제주일보 300 57.6%            14 0.0% 98.2%
메디컬투데이 301 57.8%            14 0.0% 98.2%
이코노미톡뉴스 302 58.0%            14 0.0% 98.2%
위클리오늘 303 58.2%            14 0.0% 98.2%
법률저널 304 58.3%            14 0.0% 98.3%
울산제일일보 305 58.5%            13 0.0% 98.3%
안동MBC 306 58.7%            13 0.0% 98.3%
PD저널 307 58.9%            13 0.0% 98.3%
동양일보 308 59.1%            12 0.0% 98.4%
농업인신문 309 59.3%            12 0.0% 98.4%
전자신문언론사 선정 310 59.5%            12 0.0% 98.4%
시사뉴스 311 59.7%            12 0.0% 98.4%
스포츠투데이 312 59.9%            12 0.0% 98.5%
스타뉴스 313 60.1%            12 0.0% 98.5%
키즈TV 314 60.3%            12 0.0% 98.5%
미주중앙일보 315 60.5%            12 0.0% 98.5%
미래한국 316 60.7%            11 0.0% 98.5%
논객닷컴 317 60.8%            11 0.0% 98.6%
뉴스후플러스 318 61.0%            11 0.0% 98.6%
제주신보 319 61.2%            11 0.0% 98.6%
뉴스톱 320 61.4%            11 0.0% 98.6%
주간한국 321 61.6%            11 0.0% 98.6%
주간조선 322 61.8%            11 0.0% 98.7%
대전MBC 323 62.0%            10 0.0% 98.7%
대학저널 324 62.2%            10 0.0% 98.7%
전기신문 325 62.4%            10 0.0% 98.7%
오피니언뉴스 326 62.6%            10 0.0% 98.7%
뉴스컬처 327 62.8%            10 0.0% 98.8%
뉴스민 328 63.0%            10 0.0% 98.8%
에듀프레스 329 63.1%            10 0.0% 98.8%
CJ헬로 330 63.3%              9 0.0% 98.8%
통일뉴스 331 63.5%              9 0.0% 98.8%
디지털데일리 332 63.7%              9 0.0% 98.8%
미디어워치 333 63.9%              9 0.0% 98.9%
말산업저널 334 64.1%              9 0.0% 98.9%
미주한국일보 335 64.3%              9 0.0% 98.9%
헤럴드POP 336 64.5%              9 0.0% 98.9%
미디어SR 337 64.7%              9 0.0% 98.9%
CNB저널 338 64.9%              8 0.0% 98.9%
뉴스엔 339 65.1%              8 0.0% 99.0%
건설경제신문 340 65.3%              8 0.0% 99.0%
NSP통신 341 65.5%              8 0.0% 99.0%
동아사이언스 342 65.6%              8 0.0% 99.0%
김해뉴스 343 65.8%              8 0.0% 99.0%
의학신문 344 66.0%              7 0.0% 99.0%
인사이트코리아 345 66.2%              7 0.0% 99.0%
메디칼업저버 346 66.4%              7 0.0% 99.1%
조이뉴스24 347 66.6%              7 0.0% 99.1%
주간동아 348 66.8%              7 0.0% 99.1%
TJB 대전방송 349 67.0%              7 0.0% 99.1%
환경일보 350 67.2%              7 0.0% 99.1%
디지털데일리언론사 선정 351 67.4%              7 0.0% 99.1%
키즈맘 352 67.6%              7 0.0% 99.1%
이코노믹리뷰 353 67.8%              7 0.0% 99.1%
정책브리핑 354 67.9%              6 0.0% 99.2%
충청뉴스 355 68.1%              6 0.0% 99.2%
TBC대구방송 356 68.3%              6 0.0% 99.2%
평화뉴스 357 68.5%              6 0.0% 99.2%
ZDNet Korea 358 68.7%              6 0.0% 99.2%
빅데이터뉴스 359 68.9%              6 0.0% 99.2%
광명지역신문 360 69.1%              6 0.0% 99.2%
골프타임즈 361 69.3%              6 0.0% 99.2%
경인방송 362 69.5%              6 0.0% 99.2%
독서신문 363 69.7%              6 0.0% 99.3%
세계파이낸스 364 69.9%              6 0.0% 99.3%
비욘드포스트 365 70.1%              5 0.0% 99.3%
메디칼트리뷴 366 70.2%              5 0.0% 99.3%
FAM타임스 367 70.4%              5 0.0% 99.3%
메디컬월드뉴스 368 70.6%              5 0.0% 99.3%
공유경제신문 369 70.8%              5 0.0% 99.3%
티브로드 370 71.0%              5 0.0% 99.3%
국방일보 371 71.2%              5 0.0% 99.3%
톱데일리 372 71.4%              5 0.0% 99.3%
방송기술저널 373 71.6%              5 0.0% 99.4%
매일경제TV 374 71.8%              5 0.0% 99.4%
후생신보 375 72.0%              5 0.0% 99.4%
데일리팜 376 72.2%              5 0.0% 99.4%
대구MBC 377 72.4%              5 0.0% 99.4%
OSEN 378 72.6%              5 0.0% 99.4%
제주의소리 379 72.7%              5 0.0% 99.4%
스포츠월드 380 72.9%              5 0.0% 99.4%
스포츠한국 381 73.1%              5 0.0% 99.4%
시사IN 382 73.3%              5 0.0% 99.4%
스포츠동아 383 73.5%              5 0.0% 99.4%
더피알 384 73.7%              5 0.0% 99.5%
일간리더스경제 385 73.9%              5 0.0% 99.5%
일간스포츠 386 74.1%              5 0.0% 99.5%
ZDNet Korea언론사 선정 387 74.3%              4 0.0% 99.5%
교통신문 388 74.5%              4 0.0% 99.5%
공무원수험신문 389 74.7%              4 0.0% 99.5%
JIBS 390 74.9%              4 0.0% 99.5%
경남데일리 391 75.0%              4 0.0% 99.5%
국회 392 75.2%              4 0.0% 99.5%
MK스포츠 393 75.4%              4 0.0% 99.5%
Tomorrow 394 75.6%              4 0.0% 99.5%
보건뉴스 395 75.8%              4 0.0% 99.5%
한국교육신문 396 76.0%              4 0.0% 99.5%
딴지일보 397 76.2%              4 0.0% 99.6%
코메디닷컴 398 76.4%              4 0.0% 99.6%
울산저널 399 76.6%              4 0.0% 99.6%
비즈니스워치 400 76.8%              4 0.0% 99.6%
주간경향 401 77.0%              4 0.0% 99.6%
조선에듀 402 77.2%              4 0.0% 99.6%
메디컬리포트 403 77.4%              4 0.0% 99.6%
데일리굿뉴스 404 77.5%              4 0.0% 99.6%
한겨레21 405 77.7%              4 0.0% 99.6%
더스쿠프 406 77.9%              4 0.0% 99.6%
에듀동아 407 78.1%              4 0.0% 99.6%
비즈한국 408 78.3%              4 0.0% 99.6%
일간NTN 409 78.5%              4 0.0% 99.6%
대전시티저널 410 78.7%              4 0.0% 99.6%
블록체인밸리 411 78.9%              4 0.0% 99.7%
헤드라인제주 412 79.1%              4 0.0% 99.7%
헬로디디 413 79.3%              4 0.0% 99.7%
조선비즈 414 79.5%              3 0.0% 99.7%
비마이너 415 79.7%              3 0.0% 99.7%
SBS funE 416 79.8%              3 0.0% 99.7%
인베스트조선 417 80.0%              3 0.0% 99.7%
YTN사이언스 418 80.2%              3 0.0% 99.7%
교수신문 419 80.4%              3 0.0% 99.7%
월드코리안신문 420 80.6%              3 0.0% 99.7%
MBC연예 421 80.8%              3 0.0% 99.7%
데일리팝 422 81.0%              3 0.0% 99.7%
그린포스트코리아 423 81.2%              3 0.0% 99.7%
파이낸셜투데이 424 81.4%              3 0.0% 99.7%
FETV 425 81.6%              3 0.0% 99.7%
뉴스페이퍼 426 81.8%              3 0.0% 99.7%
안전신문 427 82.0%              3 0.0% 99.7%
뉴스앤조이 428 82.1%              3 0.0% 99.8%
여행레저신문 429 82.3%              2 0.0% 99.8%
e의료정보 430 82.5%              2 0.0% 99.8%
웹데일리 431 82.7%              2 0.0% 99.8%
농업경제신문 432 82.9%              2 0.0% 99.8%
약사공론 433 83.1%              2 0.0% 99.8%
경기도민일보 434 83.3%              2 0.0% 99.8%
가톨릭뉴스 지금여기 435 83.5%              2 0.0% 99.8%
약업신문 436 83.7%              2 0.0% 99.8%
이로운넷 437 83.9%              2 0.0% 99.8%
인더뉴스 438 84.1%              2 0.0% 99.8%
인천투데이 439 84.3%              2 0.0% 99.8%
전남매일 440 84.5%              2 0.0% 99.8%
씨네21 441 84.6%              2 0.0% 99.8%
중소기업신문 442 84.8%              2 0.0% 99.8%
참여와혁신 443 85.0%              2 0.0% 99.8%
축산신문 444 85.2%              2 0.0% 99.8%
테크홀릭 445 85.4%              2 0.0% 99.8%
텐아시아 446 85.6%              2 0.0% 99.8%
한경비즈니스 447 85.8%              2 0.0% 99.8%
한국농어민신문 448 86.0%              2 0.0% 99.8%
한국농어촌방송 449 86.2%              2 0.0% 99.8%
한국정책신문 450 86.4%              2 0.0% 99.8%
한의신문 451 86.6%              2 0.0% 99.8%
아유경제 452 86.8%              2 0.0% 99.8%
BBC 453 86.9%              2 0.0% 99.8%
신동아 454 87.1%              2 0.0% 99.9%
세정일보 455 87.3%              2 0.0% 99.9%
메디소비자뉴스 456 87.5%              2 0.0% 99.9%
백세시대 457 87.7%              2 0.0% 99.9%
매경이코노미 458 87.9%              2 0.0% 99.9%
리걸타임즈 459 88.1%              2 0.0% 99.9%
베이비뉴스 460 88.3%              2 0.0% 99.9%
베이비타임즈 461 88.5%              2 0.0% 99.9%
데일리스포츠한국 462 88.7%              2 0.0% 99.9%
기자협회보 463 88.9%              2 0.0% 99.9%
비즈엔터 464 89.1%              2 0.0% 99.9%
광주드림 465 89.3%              2 0.0% 99.9%
뉴스경남 466 89.4%              2 0.0% 99.9%
스포티비뉴스 467 89.6%              2 0.0% 99.9%
스포츠Q 468 89.8%              2 0.0% 99.9%
현대HCN 새로넷방송 469 90.0%              1 0.0% 99.9%
조선펍 470 90.2%              1 0.0% 99.9%
현대경제신문 471 90.4%              1 0.0% 99.9%
CEO스코어데일리 472 90.6%              1 0.0% 99.9%
마켓뉴스 473 90.8%              1 0.0% 99.9%
초이스경제 474 91.0%              1 0.0% 99.9%
치과신문 475 91.2%              1 0.0% 99.9%
딜라이트닷넷 476 91.4%              1 0.0% 99.9%
국제섬유신문 477 91.6%              1 0.0% 99.9%
넥스트데일리 478 91.7%              1 0.0% 99.9%
대한금융신문 479 91.9%              1 0.0% 99.9%
디지틀조선일보 480 92.1%              1 0.0% 99.9%
디지털투데이 481 92.3%              1 0.0% 99.9%
농축유통신문 482 92.5%              1 0.0% 99.9%
데이터뉴스 483 92.7%              1 0.0% 99.9%
노트펫 484 92.9%              1 0.0% 99.9%
문학뉴스 485 93.1%              1 0.0% 99.9%
대한전문건설신문 486 93.3%              1 0.0% 99.9%
대한변협신문 487 93.5%              1 0.0% 99.9%
대한급식신문 488 93.7%              1 0.0% 99.9%
한국스포츠통신 489 93.9%              1 0.0% 99.9%
헬스조선 490 94.0%              1 0.0% 99.9%
민중당 491 94.2%              1 0.0% 99.9%
미디어오늘 492 94.4%              1 0.0% 99.9%
미디어제주 493 94.6%              1 0.0% 99.9%
게임톡 494 94.8%              1 0.0% 100.0%
슬로우뉴스 495 95.0%              1 0.0% 100.0%
스타트업투데이 496 95.2%              1 0.0% 100.0%
에이블뉴스 497 95.4%              1 0.0% 100.0%
소비자가 만드는 신문 498 95.6%              1 0.0% 100.0%
ㅍㅍㅅㅅ 499 95.8%              1 0.0% 100.0%
topclass 500 96.0%              1 0.0% 100.0%
엠스플뉴스 501 96.2%              1 0.0% 100.0%
여성조선 502 96.4%              1 0.0% 100.0%
kbc광주방송 503 96.5%              1 0.0% 100.0%
여수넷통뉴스 504 96.7%              1 0.0% 100.0%
bnt뉴스 505 96.9%              1 0.0% 100.0%
세정신문 506 97.1%              1 0.0% 100.0%
월간마이더스 507 97.3%              1 0.0% 100.0%
북DB 508 97.5%              1 0.0% 100.0%
월간원예 509 97.7%              1 0.0% 100.0%
보안뉴스 510 97.9%              1 0.0% 100.0%
VOGUE 511 98.1%              1 0.0% 100.0%
이슈메이커 512 98.3%              1 0.0% 100.0%
이코노미조선 513 98.5%              1 0.0% 100.0%
TV리포트 514 98.7%              1 0.0% 100.0%
고양신문 515 98.8%              1 0.0% 100.0%
인더스트리뉴스 516 99.0%              1 0.0% 100.0%
법보신문 517 99.2%              1 0.0% 100.0%
인천뉴스 518 99.4%              1 0.0% 100.0%
시장경제신문 519 99.6%              1 0.0% 100.0%
인터뷰365 520 99.8%              1 0.0% 100.0%
농민신문 521 100.0%              1 0.0% 100.0%
         54,111  



연합뉴스가  '조국 법무부' 키워드 뉴스 건수 1등일 줄 알았는데요, 의외로 '뉴스1'이 1등, '뉴시스'가 3등, '머니투데이'가 4등입니다. 그래서 궁금해서 '뉴스1'이랑 '뉴시스', '머니투데이'에 대해서 구글링을 해보았습니다. 


그랬더니  '조국 법무부' 키워드 뉴스 건수 1등 '뉴스1', 3등 '뉴시스', 4등 '머니투데이', 8등 '중앙일보'가 지분구조가 서로 연결이 되어있네요 (아래 지배구조 참조). 이들 4개사를 '머니투데이 패밀리'로 묶어서 보면 최근 한달 '조국 법무부' 키워드 뉴스 건수 중 '머니투데이 패밀리' 4개 사가 7,388 건 (13.7%) / 총 54,111 건(100%) 을 차지합니다. 



* 누가 한국언론을 지배하는가, 47개 주요 언론사 지배구조 분석 (* 출처: http://www.mediax.kr/?p=686)










Posted by R Friend R_Friend

댓글을 달아 주세요

지난주 월요일(8월 26일) 자정 쯤에 네이버(Naver)에서 조국 법무부 장관 후보자와 타 장관 후보자, 황교안 전 법무부 장관, 고 노무현 대통령님에 대한 뉴스기사 건수를 조회한 후에 "조국 법무부장관 후보에 대한 최근 한달 뉴스 건수 비교로 본 언론의 광기 (2019.07.27 ~ 2019.08.26)" 라는 블로그 포스팅을 했었습니다. 


오늘(9월 6일) 밤에 다시 지난번과 동일한 조건으로 네이버 뉴스기사 조회를 해보니 다른 후보자의 뉴스건수는 변동이 없는 반면에, 유독 조국 법무부 장관 후보자의 뉴스 기사 건수만 (2019.08.26일 검색 시점)  75,292건 에서 (2019.09.06일 검색 시점) 28,216건으로 47,076건(62.5%)이 줄어들었습니다. 



[동일 조회기간/조건에 대해 '19.08.26일 조회시점 vs. '19.09.06일 조회시점 간 

네이버(Naver) 뉴스 건수 차이 비교]


 구분

뉴스 기사 대상 

 2019.08.26일

조회 시점

뉴스 건수(a)

2019.09.06

조회 시점

뉴스 건수(b)

동일 기준

뉴스 조회 시

뉴스 건수 차이

(=a-b) 

 2019.08

장관 

후보자

 조국 법무부장관 후보

75,292 

28,216 

-47,076 

 은성수 금융위원장 후보

2,078 

2,078 

 한상혁 방송통신위원장 후보

1,502 

1,515 

+13 

 조성욱 공정위원장 후보

1,451 

1,450 

-1 

 최기영 과학기술부장관 후보

1,439 

1,437 

-2 

 김현수 농림축산부장관 후보

1,325 

1,326 

+1 

 이정옥 여성가족부장관 후보

991 

990 

-1 

    황교안 전 법무부 장관

1,122 

1,122 

    고 노무현 대통령님

17,304 

17,304 

(* remark: 08.26일 밤 10시쯤 블로그 쓰기 시작했을 때 조국 법무부장관 후보자 뉴스건수 조회 시 73,391건이어서 그래프 그려서 포스팅을 했었구요, 08.26일 자정이 좀 넘어서 조회결과 화면 캡쳐하려고 보니 75,292건으로 좀 더 늘어나있어서 이전 포스팅의 막대그래프와 화면캡쳐의 숫자가 좀 다릅니다.)



[네이버 뉴스기사 건수 조회 조건]


 구분

 뉴스기사 조회 기간

 뉴스 검색 키워드

 공통

조국 후보자외 

금번 장관 후보자

 2019.07.26 ~ 2019.08.26

 조국 법무부, 은성수 금융, 한상혁 방송통신, 조성욱 공정, 최기영 과학기술, 김현수 농림축산, 이정옥 여성가족부

영역:전체
유형:전체
언론사:전체

황교안 

전 법무부 장관

 2013.01.21 ~ 2013.02.21

(인사청문회 1주일전까지)

 황교안 법무부

고 노무현 

대통령님

 2009.04.01 ~ 2009.05.22

(서거일 하루전까지)

 노무현 대통령




"유독 조국 법무부장관 후보자에 대해서만" 언론사에서 뉴스를 삭제하고 있는 것인지, 아니면 네이버에서 뉴스를 삭제하고 있거나 어떤 조치를 취하고 있는 것인지 궁금합니다. 


만약 언론사든 네이버든 조국 법무부장관 후보자에 대한 뉴스기사를 삭제하고 있다면 무슨 이유로 삭제를 하는 것인지 궁금합니다.  혹시 언론사에서 의혹이 아닌 걸로 판명난 오보 기사에 대해서 자진해서 삭제를 한 것일까요? 아니면 언론사가 무분별하게 업로드한 뉴스들 중에서 네이버에서 '중복 뉴스 제거(알고리즘으로 중복 여부 판별???)' 같은 관리 차원의 조치를 한 것일까요? 




아래는 8월 26일과 9월 6일에 각각 동일 조건으로 네이버 뉴스 기사 조회결과 화면 캡쳐한 이미지입니다. 







제가 네이버 뉴스 검색에 대한 뭔가 중요한 것을 잘못 알고 있는 것인가요? 네이버 내부 사정 아시는 분은 댓글 남겨주시면 감사하겠습니다. 

Posted by R Friend R_Friend

댓글을 달아 주세요

JTBC 뉴스에서 Youtube에 올린 [조국 법무부 장관 후보자 기자간담회] 9월2일 뉴스특보 1부 풀영상 (오후 3시30분 ~ 오후 6시까지)의 기자 간담회의 언론사, 기자별 질문 주제 리스트를 정리해보았습니다. 

(Youtube 들으면서 정리하다보니 언론사 이름, 기자 이름을 정확하게 알아듣지 못한 부분이 있습니다. 두번, 세번 들어도 잘 못알아들겠는 언론사와 기자 이름은 물음표로 표시했습니다.)


기자 간담회 1부의 2시간 30분 동안 총 34명의 기자가 질문을 하였으며, 이중에서 사법개혁, 검찰 개혁 관련 질문은 기자 2명이서 해주었습니다. 사법개혁 질문하신 기자분께서는 사회자가 정책 관련 질문도 해달라고 요청해서 분위기 전환(?)을 위해서 정책질문 하겠다고 말씀해주시네요. 


법무부장관 후보자에 대해서 사법개혁, 검찰개혁 어떻게 할지에 대한 비전, 정책, 실행방안 등에 대한 질문은 6% 였구요, 후보자의 거취에 대한 질문 10%, 과거 언행에 대한 질문 2%, 검찰의 압수수색 관련 8%였습니다. 이들 26%의 후보자에 대한 직접적인 질문 외에, 가족에 대한 의혹 질문이 53%, 언론/여론에 대한 질문이 22%를 차지합니다. (* remark: 아래 표와 그래프는 1부(9월2일 오후3시30분~오후6시)의 34명 기자들의 질문만을 대상으로 집계한 것입니다. 2부, 3부는 빠져있는 자료임.)





이게 조국 "법무부 장관 후보자"에 대한 기자간담회인지, 아니면 조국 "후보자의 따님과 가족"에 대한 기자간담회인지 분간이 안갑니다.  조국 후보자가 법을 위반했다는 증거는 없고, 그냥 국민의 불편한 감정을 긁어서 조국 후보자에 대한 부정적인 여론을 부추기고, 조국 후보 가족들을 볼모로 조국 후보자보고 중도 사퇴하라고 협박하는 것과 뭐가 다릅니까? 


질문 주제를 보면 장관 후보자에 대한 검증이 아니라 대통령 후보자에 대한 검증을 하고 있는게 아닌가 헷갈릴 정도입니다. 



[ 조국 법무부 장관 후보자 기자간담회 1부 (9월2일 오후3시30분~오후6시) 언론사별 기자별 질문 주제]


질문순서

언론사

기자

질문 주제

1

연합뉴스 서혜림 딸 논문 저자

2

한강타임즈 이선아 딸 인턴 프로그램

3

시사죽은 현중 박근혜 대통령 기자회견 문제

4

? ? 폴리페서, 교수 재직 여부

5

MBN 박영 딸 장학금

6

BBS(?) 박준상 대학입시, 거취

7

펜더마이크 차황면 과거의 말과 행동 일치 여부

8

연합뉴스 최덕제 딸 논문 저자

9

매일경제 홍성혁 검찰 압수수색, 언론 검증

10

CBS 박종환 사모펀드

11

프레시안 박정현 부익부빈익빈 대물림, 기회의 평등에 대한 국민정서

12

TV조선 신주명 딸 장학금, 5촌 조카 출국

13

TV조선 서주민 단국대 교수 아들과 딸이 같은 동아리 여부

14

뉴데일리 박아름

수사 대상이 되면 사퇴해야 하지 않나

15

정부일보(?) 김색(?) 의료원 원장과 만찬 의혹

16

브레이크뉴스 김충열 사법개혁, 공수처, 검경수사권 조정 방향과 로드맵

17

KBS 정재우 사모펀드

18

시사위크 최운 기자간담회 자청 이유

19

전자신문 송해연(?) 국회청문회가 열리면 참석 여부, 딸 장학금

20

아시아경제 구해리(?) 사모펀드, 관급 투자

21

중앙일보 하준호 사모펀드

22

시사주간(?) 현중 여론조사 반대 여론

23

한강타임즈 이사라 딸 논문 저자, 장학금, 단국대 교수와 관계

24

뉴스원 박재우 언론 허위사실, 사모펀드, 가족 위법 적발 시

25

채널A 강병기 키스트 인턴, 공주대 인턴, 배우자 스펙 품앗이, 사모펀드

26

위키리크스 윤여진 검경수사권 조정 정책, 박상기 장관 중국 공안 제도 언급

27

서울경제 방진혁 웅동학원 동생 소송, 딸 논문 저자

28

미디어오늘 노정(?) 기자회견 민주당과 교감여부, 정신질환범죄 인권 관련

29

KBS 조퇴규(?) 딸 논문 저자, 인턴, 장학금, 사모펀드

30

MBN 이동하 검찰이 후보자 수사 중인데 사법개혁 할 수 있나, 거취

31

조선비즈 김민우 딸 장학금, 법무부장관 덕목 세가지, 청년 분노, 금수저

32

한겨레 서현지 단국대 인턴프로그램, 사모펀드, 특검 발동 권한

33

MBC 서명산 국민정서법 대비 현행법 위반 없다는 셀프 검증아닌가, 국민반대여론

34

티뷰손(?) 김종(?) 법무 후보자의 발언이 수사지침이 될수 있냐는 법적근거



저는 이참에 장관 후보자에 대한 인사청문회 취지가 뭔지에 대해서도 국민들 사이에 고민해보는 기회가 되면 좋겠습니다. 


물론 능력과 도덕성을 겸비한 장관이면 금상첨화일텐데요, 지금 조국 법무부장관 후보자에 대한 기자간담회 질문, 그리고 그동안의 뉴스 기사의 내용도 보면 "법무부 장관으로서의 능력, 정책"에 대한 것보다는 "가족에 대한 의혹, 도덕성 흡집내기"가 주를 이루었기에 도가 너무 지나치다는 점을 지적하고 싶은 것입니다. 


제 생각에는 한 나라의 장관이라 함은 대통령이 혼자서 모든 국정 일을 다 챙기면서 일을 할 수도 없고, 또 그렇게 일을 해서도 안되기 때문에 각 부처별 전문성과 소명의식을 가지고 대통령과 코드를 맞춰가면서 국익을 위해, 국민을 위해 일을 이루어 나가는 사람이라고 생각합니다. 그런데 조국 법무부장관 후보자의 인사청문회 준비하는 최근 몇 주간의 과정이나, 오늘 기자간담회의 기자분들의 질문 주제를 보면 인생을 살아오면서 흠결이 하나도 없는, 순결무결한 성직자 같은 사람을 찾는거 같습니다. 그러면서 부처 업무 추진을 위한 전문성도 있어야 하고, 야당과 언론의 무차별적이고 인권유린적인 맹폭을 견딜만한 맷집도 있어야 하고, 새벽 2시까지 기자간담회를 정신줄 놓지 않고 성실하게 답변할 수 있는 체력, 정신력도 있어야 겠고, 기자들의 비슷한 질문들 계속 받으면서도 짜증 안내고 조신조신 답변할 수 있는 평정심과 품격도 있어야 하고.... 


이러고 나면 나중에 누가 장관해보겠다고 나서겠습니까? 자신이 검증당하고 상처입는거야 견디려면 견딜 수 있다지만, 후보에게서 결격사유가 안나오면 배우자와 아들, 딸을 인질로 삼아 후벼파면서 후보자를 압박하면 앞으로 누가 장관하겠다고 하겠습니까? 대통령이나 총리 뽑는것도 아니고 장관 뽑는건데 말이죠. 


기자 질문 중에 "후보자께서 현행법을 위반했다는 증거는 없지만 현행법보다 더 무서운 국민 정서법에 반하는 가족 특혜가 있었고, 여론이 안좋고 하니 장관 후보자 사퇴할 의향은 없습니까?" 라고 묻던데요, "카더라" 의혹 뉴스 기사로 한달간을 여론몰이한 언론이 "여론이 안좋다"는 이유로 중도사퇴하라고 종용하는게 참 어처구니가 없었습니다. 


이번에 자유한국당과 언론사, 기자들은 조국 후보자가 언론의 뉴스 기사 맹폭에 질려서 자진사퇴할 것으로 예상했던게 아닌가 싶은데요, 되려 자유한국당과 언론사들이 이번에 조국 법무부장관 후보자를 차기 대권 후보자로 급상승시켜주는 일등공신을 했다는 생각도 듭니다. 


자유한국당은 이번에 조국 법무부장관 후보자에게 쏟아냈던 검증의 잣대, 의혹제기, 청문회 가족증인신청 요구사항 등... 이 모든 것이 부메랑이 되어 돌아갈 것임을 명심하시기 바랍니다. 자유한국당에 이번 조국 후보자에게 가해진 언론의 맹폭을 견딜만한 사람이 있을려나요? (나경원 의원님은 자녀 대학입학, 사학재단 등 의혹이 솔찬히 되니 언제 고위공직자로 추천을 받게된다면 본인의 인사청문회에 대한 소신대로 인사 청문회에 가족들 증인으로 데리고 나와서 검증을 받아주시면 좋겠습니다!)


언론은, 또 자유한국당은 "인간에 대한 예의", "인간으로서 넘지 말아야할 선"이 무엇인지에 대해서 한번 생각해보시기 바랍니다. 그리고 조국 후보자에게 들이대었던 도덕 기준을 거울 속에 비친 자신에게도, 자신의 가족에게도 한번 비추어보는 시간을 가져보면 좋겠습니다. 

그리고 "법무부 장관 후보자"에 대한 검증이면 "사법/검찰개혁에 대한 비전, 정책, 소명, 자질"에 대한 질문도 좀더 비중있게 다루어주기를 바래봅니다. (질문 주제 비중의 고작 6%가 뭡니까!)


마지막으로, 조국 후보자님 따님께서는 얼마나 힘드실까 걱정이 됩니다. 저도 아들, 딸 가진 부모로서 지금 이런 기자들의 잔인함에 너무너무 화가 납니다. 부디 잘 견디시고 힘내시길 바래요. 조국 후보자님 존경하고 지지하는 사람들도 많다는 것 알아주시구요. 

Posted by R Friend R_Friend

댓글을 달아 주세요

2019년 8월 9일 문재인 대통령님께서 10곳의 장관급 인사를 교체하는 개각을 단행하였으며, 이중 장관 인사청문회를 해야 하는 후보자가 7명입니다. 

(조국 법무부장관 후보, 은성수 금융위원장 후보, 한상혁 방송통신위원장 후보, 조성욱 공정위원장 후보, 최기영 과학기술정보통신부장관 후보, 김현수 농림축산식품부장관 후보, 이정옥 여성가족부장관 후보) 

조국 후보자에 대한 묻지마 의혹 제기 기사는 차고도 넘치는 반면에 타 후보자에 대한 뉴스 기사를 억지로 키워드 검색을 하지 않는 이상 뉴스를 접하기가 쉽지 않습니다. 

최근 한 달 기간 (2019.07.27 ~ 2019.08.26) 동안 이들 7명의 뉴스 기사 건수를 Naver 뉴스 검색을 통해서 조사를 해보았습니다. 

조국 후보자에 대한 뉴스 건수는 73,391건이고, 그 외 6명의 장관 후보자들의 평균 뉴스 건수는 1,464건입니다. 조국 후보자와 타 후부자 간에 뉴스 건수가 50배의 차이가 납니다. 

언론이 미치지 않고서야 이럴 수가 없습니다. 역대 비교 불가입니다. 

(너무나 차이가 많이 나서 검색 설정을 잘못한건가 싶을 정도인데요, 혹시 Naver의 뉴스 기사 검색에서 기사 건수 세는 알고리즘 자세히 알고 계신분은 댓글 남겨주세요.)


[ 조국 법무부장관 후보자에 대한 최근 한달(2019.7.27~2019.8.26) 뉴스 건수 비교 ]


* 검색 키워드는 '이름 부서' (조국 법무부, 은성수 금융, 한상혁 방송통신, 조성욱 공정, 최기영 과학기술, 김현수 농림축산, 이정옥 여성가족부, 황교안 법무부, 노무현 대통령) 를 사용하였습니다. 


조국 법무부 장관 후보자 청문회가 오늘부터 일주일 뒤인 9월2일~9월3일로 잡혔네요. 

궁금해서 황교안 전 법무부장관에 대한 인사청문회 시점의 뉴스 기사 건수도 한번 조사해보았습니다. 조국 후부자와의 비교를 위해서 황교안 법무부장관 후보 인사청문회가 있었던 2013년 2월 28일을 기준으로 일주일 전인 2013년 2월 21일까지 한달간의 뉴스 기사를 조사해보았습니다. (뉴스기사 조회 기간: 2013.01.21~2013.02.21 (1달), 인사청문회 일주일 전까지) 

조국 후보자의 뉴스 건수는 황교안 전 법무부장관 후보자에 대한 뉴스 건수 1,122건과는 65배 차이가 납니다. 

이게 정상이라고 생각하시나요? 이게 말이 됩니까? 황교안 전 법무부장관이 의혹 제기할 것이, 검증할 것이 별로 없었냐 하면 그건 아니잖아요? 


제가 대학생 때 '현대사회의 과제'라는 교양수업 시간에 발표 과제가 있었는데요, 저는 '조선일보와 한겨레신문 기사 모니터링'을 해서 발표를 했던 기억이 납니다. 2주 동안 매일 도서관에 가서 조선일보와 한겨레신문을 비교하면서 '같은 사건'을 두 신문사가 어떻게 '다르게' 쓰는지를 비교해볼 수 있는 기회였습니다. 

이 과제 이전에 제가 가지고 있던 신문 뉴스에 대한 생각은 "언론사는 공평하고 중립이며, 신문 기사는 사실을 전달하므로 믿어도 된다. 기자는 양심과 소명의식에 따라 신문기사를 작성한다." 였습니다. 그런데 이 2주짜리 모니터링 후 과제 발표를 할 때 이런 내용으로 발표를 했습니다. 

  • 언론은 절대 공평하지도, 중립적이지도 않다. 
  • 언론사는 각자 프레임, 아젠다를 선점하기 위해 전쟁을 벌이고 있다. 
  • 같은 사건에 대해서도 누가, 어떤 관점으로, 무슨 의도를 가지고 쓰느냐에 따라 정반대 내용이 될 수 있다.
  • 산소같은 언론의 기능은 커녕 사회에 해악을 끼치는 암적인 언론도 있다. 
  • 어떤 뉴스를 취사선택해서, 어느면에 배치하고, 헤드라인은 어떻게 뽑고, 사진과 그래프는 또 어떻게 하는냐에 따라 천당과 지옥을 오가게 할 수 있다. 

뭐, 이런 내용이었습니다. 그리고 이 발표 후에 "안티조선" 스티거 여기저기 많이 붙이고 다녔던 기억이 납니다. 그리고 조중동과 그 인터넷자회사들이 쓴 신문기사를 보면 "이 악날한 것들이 이번에는 무슨 수작을 부리려고..." 하는 생각을 가지고 신문기사를 봅니다. 


가령, 신문기사 몇 가지 예를 들어보겠습니다. 

아래는 아시아경제의 2019.08.21일자 기사의 헤드라인인데요, 마치 딸 입시, 아들 병역에 뭔가 불법적인 문제가 있는 것처럼 써놓았습니다. 부모가 미국 유학 중에 아들을 출산해서 이중국적이고, 군대를 안가겠다고 아들이 국적을 포기한것도 아니고, 내년에 군대가겠다고 하는데도 마치 스티브유처럼 국적 포기하고 병역회피한 듯한 뉘앙스로 제목을 뽑아놨습니다. 


아래 기사는 매일경제에서 2019.08.26에 기사화를 했는데요, 제목이 "서울대생 98% 법무장관 부적합"이라고 뽑아놓았습니다. 98% 반대면 이건 북한에서나 가능한 숫자인데요, 심지어 박근혜 탄핵국면에서도 탄핵찬성이 70%~80%대 사이를 왔다갔다 했다는걸 생각해보면 98%반대는 말도 안되는데요, 헤드라인을 이렇게 뽑아놓았습니다. 

매일경제 기사를 클릭(그래, 클릭하게 해서 광고비 벌려는거 다 안다...)해서 확인해보면, '스누라이프'라는 서울대생 커뮤니티에서 온라인 설문을 했는데요, 투표 참가인원이 2,151명이라고 하고, 그중에 98%가 "조국 후보자 법무부장관 부적합"이라고 응답을 했다는 겁니다. (매일경제 하면 "조국 딸 오피스텔 포르쉐 2대"라는 허위 기사 올렸다가 순삭한 경력이 있는 그 MK 맞습니다. 에휴, 황색저널리즘의 끝판왕... -_-;)

그런데 문제는 이런 방식의 설문조사를 하면 "무응답 편향(non-response bias)"이 발생합니다. 무작위로 성별/연령/지역별 층을 나누어서 샘플링을 해서 조사를 한게 아니구요, 그냥 설문 하고 싶은 사람이 와서 응답을 할 경우에는 모집단을 절대로 대표할 수가 없습니다. 

검색해보니 서울대 재학생이 28,630명인데요, 그러면 7.5%가 설문에 참여한겁니다. 저라면 "서울대학교 내에 자유한국당을 지지하는 학생 비율이 최소 7.5% 정도는 되나?"라고 추측을 해보는게 "서울대생의 98%는 조국후보자의 장관 선임을 반대해"라고 해석하는 것보다 더 합리적일 것 같습니다. -_-;

기자를 할 정도면 시장조사방법론에 대해서는 기본적으로 알고 있을 것이라고 예상을 하는데요, 알고도 이를 이딴식으로 기사화했다면 악의적인 것이구요, 모르고 기사화했다면 기자 자질이 의심스러운거지요. 


아래 기사는 서울신문에서 2019.08.25일 게재한 KBS '일요진단 라이브'의 의뢰로 진행한 설문조사 결과에 대한 기사입니다. 헤드라인을 "조국, 법무부 장관 부적합 48%... '적합'은 18% 그쳐"라고 해놓았습니다. 그리고 클릭(-_-; 결국 클릭을 하게 만드는...)해서 기사 본문을 확인해보면 "아직까지 적합.부적합 여부를 판단하기 어렵다"는 답변은 34%로 조사됐다는 내용이 나옵니다. 제가 데스크의 편집국에 있었다면 있는 그대로 "부적합 48%, 판단 보류 34%, 적합 18%"라고 제목을 뽑았을거 같습니다. 판단보류라는 34%의 민심, 일단 청문회에서 조국 후보자가 무슨 해명을 하는지 들어도 보고, 또 사법개혁, 검찰개혁에 대해서도 들어본 후에 결정하겠다는 목소리는 제목에서 쏙 빼고, "적합은 18%에 그쳐"라고 해서 마치 대부분은 국민은 조국 후보에 반대하는 듯한 인상을 주고 있습니다. 

이러한 제목뽑기가 참 악랄한 것이요, 요즘 사람들 바빠서 기사 전체를 꼼꼼하게 다 읽지 않고 제목 보고, 요약한거 보고, 중간 중간 스킵하면서 스마트폰으로 신문기사를 보잖아요. 그리고 사람들 심리에는 무의식 중에 사회적 주류 의견에 속하려는 경향성이 있습니다. 왜냐하면 다수 의견에 속하면 왕따 당하거나 비난, 비판 받을 확률이 줄어들기 때문입니다. 위의 서울신문 기사 같은 제목에 노출이 되고 하면 '아, 주류는 조국 법무부장관 후보자에 대해서 반대인가 보구나' 라는 인식이 생길 위험이 있다는 것입니다. (서울신문이 이걸 노렸을려나요?)


아래는 중앙일보에서 2019.08.25일에 [한국당도 놀랐다...10만 집회 2030 몰리자 "우리도 어리둥절"] 이라는 헤드라인으로 기사를 냈습니다.  20~30세대가 이번에 많이 화가 난 듯 합니다. 다만, 20~30세대가 자유한국당 광화문 집회에 얼마나 참석했을지 굉장히 의구심이 들구요 (몇 명이나 와야 "몰린다"는 표현을 쓸 수 있는 걸까요?), 의도적으로 현 여당에 상대적으로 우호적인 2030세대를 이참에 여당 지지로부터 멀어지게 하려는 의도가 느껴집니다. (수구보수정당 자유한국당이 2030세대를 위해서 해준게 뭐가 있다고, 무슨 염치로 2030세대에게 표를 달라고 한단 말입니까.) 세대갈등을 봉합하는게 아니라 세대갈등을 부추기는 언론!


아래 기사는 조선일보에서 2019.08.20일에 기사화한 조국 부친 묘비 기사입니다. 자유한국당 김진태 의원이 조국 법무부 장관 후보자의 부친 묘비를 찾아가서 가족의 이름이 드러난 사진을 페이스북에 게재를 했구요, 조선일보가 이를 다시 기사화했습니다. 

조국 후보자의 동생이 이혼을 한 것이 조국 후보가 법무부 장관직을 수행하는데 무슨 관련이 있다고 인권침해소지가 다분히 있는 이런 짓을 하는 지도 모르겠구요, 언론이라면 김진태 의원의 행위에 대해서 문제제기를 해도 모자랄 판에 도리어 묘비 사진까지 곁들여서 기사화까지 했습니다. 이렇게 부모, 배우자, 딸, 형제자매, 4촌에 8촌까지 엮어 아니면 말고 식으로 가정법 의혹성 기사를 무책임하게 내보내면 누가 감히 고위공직자하겠다고 나서겠습니까. 

이런 케이스들을 일일이 열거하자면 끝이 없으므로 여기서 그치겠습니다.  


의혹에 대한 기사는 넘쳐나는데 검찰개혁, 사법개혁이 왜 필요하고, 그동안 무엇이 문제였고, 역대 정권은 왜 실패를 했고, 조국 법무부 장관 후보자의 정책은 무엇이고, 기득권의 저항을 어떻게 돌파하려는지, 현실적인 정책인지 검증해보려는 언론은 찾아보기 힘듭니다. 


저는 최근의 조국 법무부장관 후보자에 대한 언론의 광기어린 아니면 말고식 언론플레이를 볼 때 고 노무현 대통령님 때가 자꾸 오버랩이 됩니다. 지금 조국 후보자와 가족들은 얼마나 힘들어 하고 있을까 안쓰럽고 걱정도 됩니다. 

고 노무현 대통령님 서거하시기 직전인 2009.04.01 ~ 2009.05.22 일 까지의 뉴스 기사 건수도 조사를 해보았습니다. 그때 논두렁 시계, 아방궁 사저 등 지금 보면 정말 치가 떨리고 용서가 안되는 거짓 뉴스 기사들을 그때 언론사들은 저주와 조롱을 섞어서 매일 기사를 내보냈던 시기입니다. 그 당시 고 노무현 대통령님에 대한 뉴스 기사 건수 17,304건도 엄청나게 많은데요, 지금 조국 후보자에 대한 뉴스 건수 73,391건은 또 얼마나 많은 건지 비교가 될 겁니다. 


조국 후보자가 후보자 의혹에 대해서는 사과는 하되 검찰개혁의 완수를 위해 후보자 사퇴는 하지 않겠다고 하니 다행입니다. 이제 청문회 날짜가 잡혔으니 조국 후보자의 의혹에 대한 해명도 들어보고, 검찰개혁에 대해 가지고 있는 정책 방향과 철학, 의지를 들어보고나서 결정을 해도 늦지 않다고 생각합니다. (자유한국당 반대로 법으로 정해진 8월30일 청문회 기한을 못지키고 다음주로 넘어간건데요, 법을 만드는 국회의원은 법을 안지켜도 되는겁니까?


저는 견제받지 않는 권력은 반드시 부패한다고 보기 때문에 현 정부가 하려고 하는 고위공직자범죄수사처(공수처) 설치라든지 검.경 수사권 조정 등의 검찰개혁에 찬성합니다. 김영상 대통령부터 해서 역대 모든 대통령이 검찰개혁을 선거 공약으로 내세웠었습니다. 하지만 그 어느 대통령도 검찰개혁을 성공하지 못했습니다. 만약 조국 법무부 후보자가 낙마를 한다면 현 정부의 검찰개혁에 대한 드라이브의 힘을 잃고 실패할 수도 있습니다. 

x 묻은 황교안도 법무부 장관을 했는데, 겨 묻은 조국 후보자라고 법무부 장관 못할 이유가 뭐겠습니까? 

조국 법무부장관 후보자님, 검찰개혁, 사법개혁 지지합니다. 

힘내시구요! 


-------------------------------------------------------------------------------


블로그 포스팅한다고 뉴스 건수 검색했던 8월 26일 저녁 10시쯤에는 73,391이었는데요, 캡쳐하려고 8월26일 자정 넘어서 8월26일까지로 다시 검색하니깐 75,292건으로 더 늘어났네요.


(덧글) '조국 법무부' 키워드로 뉴스 기사 검색을 했는데요, 개수도 많고 타 후보들과 차이가 너무 커서 뭔가 잘못된게 아닌가하고 당황했습니다. 가령, '조국(국가)'과 '조국(후보자)'의 동음 이의어로 인해서 '조국(국가)' 내용의 노이즈가 섞여서 뉴스 기사 건수가 뻥튀기 된게 아닌가 하구요. 만약 Naver 뉴스 검색 기준이 '조국 법무부'로 검색하면 '조국 & 법무부'라면 '조국(국가)' 노이즈 기사가 포함되는 것을 막을 수 있을텐데요, '조국 or 법무부'로 혹시 뉴스 검색이 되는건 아닐까 노파심이 들어습니다. 그래서 하루치의 '조국 법무부' 키워드 뉴스 기사 검색 결과 약 2,500여개를 한페이지씩 넘겨가면서 눈으로 확인해봤습니다. '조국(사람 후보자' 기사 맞더군요. 그럼 이 포스팅의 숫자들 맞는겁니다. 


[ 조국 법무부 장관 후보자 최근 한달 뉴스 건수 ]


[ 황교안 전 법무부 장관 청문회 일주일 전까지, 한달간 뉴스 건수 ]


[ 고 노무현 대통령님 서거하시기 전 두달 뉴스 건수 ]


[ 각 부서 장관 후보자들 뉴스 건수 ]


Posted by R Friend R_Friend

댓글을 달아 주세요

박근혜 정부의 '최순실 국정농단' 사태로 온 나라가 난리도 아닙니다.  박근혜 댓통령이 부끄러움이 무엇인지를 알고 있다면, 대한민국 이 나라를 조금이라도 위하는 마음이 있다면 조속한 국정 정상화를 위해 즉각 퇴진하는 것이 마땅한 도리라고 보는데요, "평화로이 청와대에서 크리스마스를 보냈다"는 박근혜 댓통령을 보고 있노라니 역사에 어찌 기록이 되려고 저러나 참 말도 안나옵니다.

 

비선실세로 국정을 농락한 박근혜 대통령과 최순실 일당, 그리고 청문회 기간 중에 위증 공모하는 새누리당이 우리나라의 수치라면, 국민은 위대했습니다. 이 추운 날씨에도 주말이면 수십, 수백만의 국민들이 박근혜의 즉각 퇴진, 구속을 요구하면 촛불집회를 이어가고 있으니 말입니다. 저도 가족들과 같이 몇 번 촛불집회에 나가기는 했습니다만, 매번 가지는 못했습니다.  이에 거리에서 귀한 시간 내서 꾸준히 초불집회 나가주신 분들에 대한 빚진 마음과 고마움을 담아, 블로그 글로라도 뭔가 보답(?)을 하고자 몇자 적어봅니다.    

 

글의 요지는 제목처럼 '박근혜, 최순실 게이트'의 박영수 팀검팀에게 이제 데이터 과학자가 필요하다는 내용입니다. 

 

지난주 청문회 보시면서 '모르쇠'로 일관하는 능구렁이 김기춘, 미꾸라지 우병우씨를 보면서 속으로 화 많이 나셨지요?

 

박근혜 정부 권력의 실세 중의 실세, 핵심 중의 핵심이었던 김기춘 전 비서실장, 우병우 전 민정수석이 아 글쎄, 최순실을 "모른다"고 합니다. (풉~ ....  순도 99.99% 거짓말?)

 

 

 

 

위의 이미지는 한겨레 신문에서 우병우, 김기춘 검색해서 사진이랑 기사 머리글 스크랩해 본건데요, 두 증인의 "모른다" 답변에 대해 위원들의 질의가 날카롭지 못했고 "죄를 인정"하게 하는데 한계가 있었다는 지적입니다.

 

그나마 주갤(디씨인사이드 주식갤러리) 네티즌의 제보가 결정적인 역할을 해서 모르쇠 김기춘을 당황시키고 "(최순실) 이름을 못들었다 할 수 없겠다"는 증원을 이끌어낸 성과가 있었습니다.

 

우리는 주갤러가 보여준 '증거'의 힘, 'fact'의 위력을 경험했습니다.  만약 데이터 과학자가 특검팀에 합류한다면 추가적인 '증거', 'fact'를 찾아낼 수 있지 않을까 하는 기대로 이 블로그를 써봅니다. (이미 합류해서 열심히 분석을 하고 있을지도 모르지요. 요즘 과학수사대 얘기도 종종 나오곤 하니깐요)

 

손예진이 주연한 "비밀은 없다"라는 영화 보셨는지요?  역사 이래 요즘 처럼 우리의 일거수 일투족이 디지털화 되어서 네트워크 저 너머의 DB에 우리도 의식하지 못하는 사이에 차곡차곡 쌓이는 시절이 없었습니다. 이제 정말 "비밀(privacy)이 없는 시대"에 우리는 살고 있습니다. 데이터 과학자가 범죄자를 옴짝달짝 못하게 하는 증거를 찾는데 데이터가 유용하게 사용될 수 있을 것입니다.

 

제가 주목하는 데이터는 민주당의 안민석 의원이 국회에서 제기한 "박근혜 대통령 대포폰 사용 의혹"입니다.  최순실 조카 장시호씨가 대포폰 6대를 개설했고, 박근혜 대통령도 그중에 한대를 사용했을 거라는 의혹입니다.

 

* 화면캡처 출처 : https://www.youtube.com/watch?v=2io2pROsRQo

 

 

의혹으로 제기된 6대의 대포폰이 만약 사실이라면요... 6대 대포폰 사용자의 후보를 추측해볼 수 있을 것같습니다.

 

핸드폰을 사용할 때 발생되는 데이터(Call Detail Record, Packet Data 등)의 특징을 들자면,

 - (1) 누가 (who)

 - (2) 언제, 얼마의 시간동안 (when, how long)

 - (3) 어디서 (where), 이동경로 (moving route)

 - (4) 누구랑 (with whom)

 - (5) 무엇을 (what) : 통화, 문자메시지, 메신저 채팅, 인터넷 검색, 스마트폰 앱 실행 등...

 - (6) 무슨 컨텐츠로 (which contents, message) : 문자메시지 내용, 채팅 내용, 검색 키워드, 접속 사이트 주소, 로그....

 

등 민감한 정보들이 자동으로, 실시간으로, 꼬박꼬박 생성이 된다는 것입니다.  요 몇년 사이에 모든 이동통신사가 Big Data 도입한다고 난리였기 때문에, 아마도 하둡 파일 시스템에 원천 데이터의 몇 년치 데이터를 잘 저장해두었을 것으로 추측해봅니다.

 

이들은 극히 민감한 개인정보들 이므로 '개인정보 비식별화', '암호화' 되어서 이동통신사 DB에 저장이 될거고, 조회도 아무나 못하고, 요금정산(billing) 등의 용도나 NW 효율화, 최적화 등의 주로 사용이 될것 같고요, 마케팅에도 비식화 조건하에 제한적으로 사용이 될것 같습니다.

 

근데, 이번 '박근혜, 최순실 게이트'는 워낙 국가의 명운이 걸린 위중한 사안이므로 특검팀에서 법원으로 부터 수사 영장을 받으면 이동통신사 DB도 분석에 사용할 수 있지 않을까 짐작해봅니다.

(덧글 : 2015년 새누리당이 주도해서 통과시켰던 '테러방지법'을 들여다 보면 법원 영장과 서면 요청을 거치면 개인정보, 통신기록, 위치정보 수집, 추적 권한을 국가정보원에 허용하는 것이 주된 내용입니다. 국정원은 마음만 먹으면 '거의 모든 사적인 비밀'을 알 수 있는 신적인 조직, 무시무시한 조직이 된거지요)

 

대포폰의 경우는 '(1) 누가(who)' 를 알 수 없다 (개통 등록자의 profile이 거짓 정보일 것이므로...)는 점인데요, 데이터 과학자(data scientist)가 도움을 줄 수 있는 가상의 시나리오를 써보겠습니다. (잘못한 사람은 벌을 받으면 좋겠다는 희망사항이 섞인, 소설같은 분석 시나리오인데요, 분석한다는 사람은 청문회를 보고나서 이렇게 생각하기도 하는구나...하고 봐주시면 좋겠습니다.)

 

 

[ 통신, 위치 정보 분석 시나리오 ]

  • (1). 2012년 박근혜 정부 출범 이후 올해 2016년 11월까지 '청와대 위치'에서 수신, 발신 이력이 있는 모든 핸드폰의 번호를 조회한다 (=> 이동통신사 기지국 삼각측량으로 위치 추정 가능)
  • (2). (1)번에서 추출한 핸드폰 번호의 등록자, 사용자 정보를 추출한다
  • (3). (2)번에서 작성한 '핸드폰 등록자, 사용자' 정보와 '청와대 근무자 정보'를 비교한다.
  • (4). (3)의 작업 결과 '청와대 근무자 정보'와 매핑이 안되는 핸드폰 번호를 선별한다.
  • (5). (4)번에서 선별된 핸드폰 번호 중에서 대포폰이 걸려들면 (희망사항....) 
  • (6). 이 대포폰을 중심으로 '통화, 문자 송/수신 Network'를 생성 (아래 Network 이미지들 참고)

 

 [ 사담 후세인의 네트워크 ]

 

* 출처 : 'Network Science', barabasi, (http://barabasilab.neu.edu/networksciencebook/download/network_science_November_Ch1_2012.pdf)

 

 

[ 조직 내부에서 실제 일어나고 있는 상호작용 네트워크의 이해 ]

 

 

* 출처 : 'Network Science', barabasi, (http://barabasilab.neu.edu/networksciencebook/download/network_science_November_Ch1_2012.pdf)

 

참고로, 복잡계 네트워크 과학은 최근 연구가 굉장히 활발합니다. 가령, 예로 몇가지 용어들, 개념들을 나열하자면요... 노드(node), 링크(link), 방향성 있는 양방향 네트워크(directed two-sided network), 연결선 수(indegree), 출선 수(outdegree), 네트워크의 중심성(centrality), 네트워크 밀도(density), 네트워크 연결 강도(strength)나 빈도(frequency), 도달가능성(reachability), 추이성(transitivity), 상호성(reciprocity) 등... 많지요? 너무 깊이 들어가면 포스팅이 끝이 없을 것이므로 이쯤에서 pass.

 

  • (7) '대포폰 네트워크'의 주 사용 위치와 시간, 문자 메시지 내용, 상호작용 관계 등을 종합적으로 고려해 대포폰의 주인을 추정한다. 
  • (8) '대포폰 네트워크'에 걸린 '실명 핸드폰 사용자'들을 추가하여 '박근혜 & 최순실 게이트의 주연과 조연'으로 구성된 '대포폰 & 실명폰 네트워크'를 완성한다.
  • (9) 특검 검사분들께 증거로 전달한다.

 

 

 

최순실의 비자금이 10조원 정도 된다면서요?  독일 검찰에서 자금세탁 경로를 분석하고 있다는 기사도 보았는데요, 자금 세탁 탐지 분석 기법 중에 'Network analysis', 'Link Analysis' 가 있습니다. (분석 기법 상세 내용은 역시 pass... 나중에 '기계학습' 카테고리에 별도 포스팅할 기회가...그게 언제가 될지는 모르겠지만요... ^^;)

 

[ 자금세탁 탐지의 기술들]

 

* 이미지 출처 :  http://groups.csail.mit.edu/mac/classes/6.805/articles/money/ota-money-laundering/05ch4.pdf

 

 

시계열 Event log를 가지고 (1) 프로세스 자동 탐지/도출, (2) 병목구간 탐색, (3) 시간 흐름에 따른 프로세스 상에서의 Event flow animation 시각화 등에 사용하는 프로세스 마이닝(process mining) 이라는 분석 기법이 있습니다. (아래 Youtube의 프로세스 마이닝 애니메이션 참고)

 

[ 프로세스 마이닝 - 프로세스 자동 탐지 및 시계열 애니메이션 예시 ]

 

 

 

 

이 프로세스 마이닝(process mining) 기법을 사용해서 박정희 대통령 때부터 해서 박근혜-최순실 때까지의 수십년의 기간을 두고 자금의 돈세탁 흐름을 시계열 애니메이션으로 보여주면 재미있을 것 같습니다. 10조원의 돈이 하늘에서 불쑥 떨어지지는 않았을 테고요, 묵직한 종자돈이 아마도 박정희 대통령이 국민의 피같은 돈을 빼돌린 돈이였을거 같지요? (영남대 강탈, 육영재단... ) 특히, 최근에 최순실 게이트 터지고 나서 돈 세탁하느라고 돈 흐름이 아주 왕성하게 활성화되지 않았을까 추측해봅니다.

 

이 블로그에서 소개한 '네트워크 분석(network analysis, link analysis)' 내용이나 분석 기법은 일부의 예시일 뿐이구요, 데이터 과학자에게 데이터를 제공해 준다면(접근할 수 있는 권한을 준다면) 이 포스팅에서 소개한 내용 외에 훨씬 더 다양한 관점과 분석 기법을 적용해서 범죄 사실을 입증할 증거를 찾아내는데 기여를 할 수 있을 것이라고 예상합니다.  

 

 

[ 박영수 특검팀 홧팅~! ]

 

 

마지막으로, 박영수 특검팀, 응원하고 또 응원합니다. 

빛은 어둠을 이긴다는 것을, 정의는 살아있다는 것을 보여주십시요!

훗날 기록될 2016년 역사의 한 페이지를 멋지게 채워주십시요!!

Posted by R Friend R_Friend

댓글을 달아 주세요

  1. R Friend R_Friend 2017.01.21 12:24 신고  댓글주소  수정/삭제  댓글쓰기

    박근혜 대통령이랑 정호성 비서관이 대포폰 이용했다고 뉴스 나왔네요. 참나... 에휴... -_-;

며칠 전에 내년도 생일 선물을 올 해 미리 사달라고 와이프에게 졸라서 전자책 리더기를 하나 장만 하였습니다.

 

작년부터 Amazon Kindle paper white 를 사려고 했었으나, 해외출장 갔던 직장동료에게 부탁했더니... 자기들 선물 사느라 한도 초과되어서 저의 킨들 부탁은 짤리기를 여러번... 직구 하자니 수수료랑 배송료가 좀 아깝고... 밍기적 거리다가 2년이 훌쩍 지났습니다. (해외출장 기회가 왜 이리 없냐고요. -_-;)

 

그러다가 우연히 다른 사람 블로그에서 한국에서도 전자책 리더기가 이제 좀 쓸만한 게 나왔다는 포스팅을 보게 되었습니다.

 

검색을 해보니 "리디북스 페이퍼"와 한국이퍼브의 "크레마 카르타"가 많이 언급이 되길레 성능, 가격, UI/UX 등을 비교해보다가 결국 "크레마 카르타"로 결정하고 구매하게 되었습니다.  (출시된지 1년이 넘었는데 왜 할인을 안하냐고요. -_-;)

 

 

 

전자책 리더기, 케이블, 설명서, 간촐합니다.

 

 

전자책 리더기를 써보니 나쁜 점은,

  • 책장 넘길 때 버벅 거리고 번짐이 있어서 신경 쓰임

 

 

전자책 리더기 좋은 점을 들라면,

  • 배터리가 아~주 오래 간다 (스마트폰의 Kindle app으로 읽을 때와 비교 불가)

  • 가볍다 (종이책 대비. 특히 여행이나 출장갈 때 아주 좋겠죠)

  • 눈 피로가 덜하다 (스마트폰 Kindle app 대비)

  • 가격도 착하다 (스마트폰 대비... 단통법 발의한 새누리당 망해라!!!  -_-")

  • 인터넷 서핑 유혹에서 자유롭다 (스마트폰, 아이패드 대비... 어쩌면 이게 제일 중요한 것일 수도...-_-b)

 

두 어달 썼는데 아주 만족하고 있습니다.  식구들한테도 각자 하나씩 사줄까 고민할 정도로요.

 

 

오늘 포스팅의 주제는 크레마 카르타 구매하면서 생각해 보게된 "플랫폼 비즈니스 모델 (Platform business model)", "플랫폼 기업 (Platform company)" 에 대한 것입니다.  일요일이 다 가고 있으므로 짧게 쓰겠습니다. (과연? -_-?)

 

플랫폼 비즈니스 모델을 정의를 해보자면, seller와 buyer의 양쪽 이해당사자 간의 거래비용(transaction cost)를 줄여주어 가치를 창출하는, 양면 시장(two-sided markets)을 다루는 비즈니스 모델이라고 할 수 있습니다.  (데이빗 에번스와 리처드 슈말렌지는 ‘Catalyst Code’라는 책에서 ‘Match-maker’, ‘Audience-maker’, ‘Market-maker’의 세 개의 형태로 세분화하고 있습니다.)

 

(참고로, 거래비용 개념은 1930년대에 영국의 경제학자 로널드 코우즈가 기업이 생기는 이유를 설명할 때 제시한 개념임)

 

 

[ 플랫폼 비즈니스 모델 개념도 (Platform Biz. Model Architecture) ]

 

 

 

요즘에 소위 뜨는 기업, 잘 나가는 기업의 상당수가 바로 '플랫폼 기업(platform company)' 입니다.

 

이글을 쓰는 2016년 11월 5일 기준으로 미국에서 Market Capitalization 기준으로 Top 20 기업 중에서 8개가 플랫폼 기업이군요. (Apple 이 1등이라고 나오는데요, Alphabet 모회사와 Google 두개를 합치면 Alphabet Inc. 가 1등이라고 할 수 있겠네요.)

 

* Source : https://www.theonlineinvestor.com/large_caps/

 

 

요즘 미국 실리콘밸리에서 Hot 하다고 하는 회사들을 들라면, Google, Apple, Facebook, AirBnB, Uber, Ebay... 다 플랫폼 회사들이예요.  한국에서도 플랫폼 기업 Naver나 Kakao 가 현대-기아자동차를 넘어서는 날이 언젠가 올거라고 예상합니다.

 

 

플랫폼 회사의 핵심 성공 키워드는 '개방(Openness)''협력(Collaboration)' 입니다. 특히, 우리는 요즘 인터넷이랑 모바일이 실시간으로 연결되어 거래비용이 거의 '0'에 수렴하는 시대(zero transaction cost economy)에 살고 있습니다.  거래비용이 '0'이다 보니 양면시장을 다루는 플랫폼 기업의 특성 상 양면시장의 양쪽 이해당사자(two players of two-sided market) 의 수 간에 증폭적 피드백 루프 (amplifying feedback loop machanism)이 작동하게 됩니다.  '선순환 고리(virtuous cycle)'와 '악순환 고리(vicious cycle)'가 작동해서 '1등 기업이 시장의 대부분을 싹쓸이'하고 2등 이하부터는 별 영향력을 행사하지 못하게 되는 현상이 발생하게 됩니다. "가진 자가 더 가지게 될 것"이라는 마태효과가 발생하는 것입니다. 이게 참 무섭고도 매력적입니다. (1등 에게만... -_-)

 

 

[ 플랫폼 기업의 성공 키워드 : 개방과 협력 (Openness and Collabaration) ]

 

 

 

 

(위에서 크레마 카르타 샀다고 자랑질 하다가 ^^v) 왜 난데없이 '플랫폼 비즈니스 모델'을 얘기하냐고요?

 

제가 국내 전자책 리더기 중에서 구매 후보로 삼았던게 '리디북스 페이퍼(RIDIBOOKS Paper)'와 한국이퍼브의 '크레마 카르타 (crema carta)' 였습니다.  '리디북스 페이퍼'나 '크레마 카르타' 둘 다 '플랫폼 회사'의 제품입니다만, '크레마 카르타'가 '개방(openness)'과 '협력(collaboration)' 관점에서 '리디북스 페이퍼'를 압도하기 때문에 생각난 김에 정리도 할 겸 글을 쓰게 되었습니다.

 

저는 처음에 HW 기능 (페이지 넘기는 물리 버튼, (상대적으로 조금 빠른) 페이지 넘어가는 속도) 과 가격때문에 '리디북스 페이퍼'에 호감이 조금 더 갔습니다.

 

하지만, '크레마 카르타'가 제공하는 '열린 서재' 기능을 보고 나서는 아무런 주저함이나 고민없이 '크레마 카르타' 사는 걸로 마음을 정했습니다. '열린 서재' 기능은 (알리딘, Yes24, 반디앤루니스, 교보문고 등의 한국이퍼브 회원사에서 구매한 책뿐만 아니라) Amazon Kindle, 인터파크, 심지어 리디북스에서 구매한 책들도 app 을 다운받아 설치해서 읽을 수 있도록 지원해주는 기능입니다.

 

저는 Amazon 에서 구매한 책이 몇 권 있고, 알라딘과 Yes24를 이용하므로 자연스레 '크레마 카르타'로 결정한 것입니다.

 

 

[크레마 카르타의 '기본 책장' ]

 

 

 

 

 

[ 크레마 카르타의 '열린 서재' ]

 

 

 

 

 

제가 긴 얘기를 단 한 줄로 줄여서 요약하자면, '제품력(product merit)'은 '비즈니스 모델과 전략(business model & strategy)'을 이길 수 없다는 것입니다.  

 

(저에게 있어) '리디북스 페이퍼'가 비록 H/W 성능과 가격이 '크레마 카르타' 대비 조금 좋다고 생각하기는 했습니다만, 이건 비교 우위 '5점' 정도 뿐입니다. 

 

(저에게 있어) '크레마 카르타'의 '열린 서재' 기능 ('개방'과 '협력'의 비즈니스 모델과 전략)은 리디북스에서 산 책만 읽을 수 있는 '리디북스 페이퍼'에 비해 '20점' 이상의 비교 우위를 주었습니다.

 

한글로 된 eBook만 읽고, 리디북스에서 eBook을 사는 고객이라면 '리디북스 페이퍼'가 기능이나 가격면에서의 효용이 있으므로 좋은 선택이 될 것입니다.

 

하지만, 저같이 이미 Amazon, 알라딘, Yes24 에서 책을 사던 고객이라면 '크레마 카르타'이 '열린 서재'가 (H/W나 가격의 비교 열위를 감안하더라도..) 압도적인 비교우위를 제공한다고 생각합니다. (저같은 사람이 얼마나 될지는 모르겠습니다만... -,-???)

 

 

혹시나 해서 네이버 트렌드(Naver Trend)에 들어가서 '크레마 카르타'와 '리디북스 페이퍼'의 두 개 키워드로 1년치 검색 빈도 시계열 추이를 분석해보았습니다.

 

 

 

[ 네이버 키워드 트렌드 분석 : 크레마 카르타 vs. 리디북스 페이퍼 ]

 

 

 

 

 

위의 Naver 키워드 트렌드 분석 결과를 보면 올 해 2016년 들어서는 '크레마 카르타'가 '리디북스 페이퍼' 대비 2배 정도의 키워드 검색 빈도를 보여주고 있음을 알 수 있습니다.

(실제 양 제품의 판매량은 제가 내부자가 아니므로 당연히 모릅니다.)

 

 

'리디북스 페이퍼' 담당 마케팅이나 사업기획 담당하시는 분께서 이 포스팅을 보신다면, '개방'과 '협력'에 대해서 내부에서 치열한 고민을 해보시면 좋을 것 같습니다.  결국 사업 경쟁은 '50.1% vs. 49.9%'의 싸움이며, 경쟁사 제품과 단 '0.2%'의 차이가 자사 제품이 고객으로 부터 구매 선택을 받느냐(all) 아니면 못 받느냐(nothing)의 냉혹한 성적표를 받게 됩니다.

 

다시한번 강조하자면, '제품력'은 결코 '비즈니스 모델과 전략'을 이길 수 없습니다.

 

 

 

한국이퍼브의 '크레마 카르타' 담당 마케팅이나 사업기획 담당하시는 분께서 이 포스팅을 보신다면, '전략적 가격 설정'에 대해서 내부에서 치열한 고민을 해보시면 좋을 것 같습니다.  마케팅 책에 보면 ‘원가 기반 가격결정법(Cost-plus pricing)’, ‘목표수익률에 의한 가격결정법(Target-return pricing)’, ‘경쟁가격을 고려한 가격결정법(Going-rate pricing)’, ‘소비자가 느끼는 가치에 의한 가격결정법(Perceived-value pricing)’ 등이 있습니다만, 플랫폼 기업에 적합한 가격 전략은 없다고 생각합니다.  "닭이냐 달걀이냐"라는딜레마를 풀기 위해 여러 플랫폼 기업들이 (초반 한쪽 시장손해를 감수해야 할 수도 있는) 공격적이면서도 전략적인 가격 정책을 쓰고 있습니다. (예: 남자와 여자 부킹을 주선하는 나이트클럽에서 남자 손님에게는 비싼 입장료를 받고, 여자 손님은 무료 입장 시키죠.  나이트클럽 가 봐서 아는게 아니고 책 봐서 아는 거임. 의심 금지 -_-;)

 

플랫폼 비즈니스에서는 (전문용어로?) "닭이 먼저냐, 달걀이 먼저냐?"의 딜레마가 존재합니다.  팔려는 상인(seller)이 별로 없으면 선택의 폭이 줄어들므로 사려는 고객(buyer, customer)이 안오려고 합니다.  사려는 고객(buyer, customer)이 별로 없으면 팔려는 상인(seller)이 안오려고 하겠지요.  "닭(상인, seller)이 먼저냐, 달걀(고객, customer)이 먼저냐, 그것이 문제로다" 인 것이지요.

 

이 "닭이 먼저냐, 달걀이 먼저냐"라는 딜레마를 깨는데 비교적 적용하기 용이한 전략이 가격전략일 것입니다.

 

 '크레마 카르타'라는 H/W 단말기 가격(마진)을 높게 책정해서 돈 벌 생각하지 마시고, '크레마 카르타'를 원가 혹은 원가 이하의 전략적 가격으로 승부수를 던져서 시장에 단기간에 확산을 시키고요, 고객들이 '크레마 카르타'에서 읽을 전자책을 살 테니 컨텐츠 판매(추가 제작비, 배송비 등의 거래비용 거의 '0'원)에서 수익을 얻으라는 말입니다.  '크레마 카르타' 판매가 늘어날 수록 '경험곡선효과'에 의해서 생산단가도 떨어지는 부수적인 이익 증가 요인도 있습니다. (난 이미 15만 9천원 다 주고 샀는데... 지금 가격을 낮추면 속이 쓰릴 듯... ㅜ,ㅜ)

 

 

만약, '크레마 카르타' H/W 단말기 담당 조직에게 '수익'이라는 KPI 지표가 할당되었다면 아마도 '전자책 담당 마케팅 부서'와 '크레마 카르타 담당 마케팅 부서'의 이해관계가 상충하게 될텐데요, 이럴 경우에는 전사 차원에서 KPI 조율을 해줘야 겠지요. '크레마 카르타' 담당 부서에는 경쟁사에 상응하거나 상회하는 기능 설계/제작, 신속한 버그 개선 등의 지표를 KPI로 할당하고, '수익' 관점의 KPI 지표를 부여하면 안되겠지요. 

 

 

 

그리고요, 브랜드 이름이 '크레마 카르타'인게 좀 실책인거 같습니다.  "기억하기 쉽고, 발음하기 쉽고, 짧고, 전자책 리더기 연상이 자연스레 되는" 브랜드 이름이 더 있을 법도 한데... 굳이 "기억하기 어렵고, 발음하기 어렵고, 길고(무려 6음절~!), 자책 리더기라고 연상이 잘 안되는"... '크레마 카르타'를 선택한 이유가 뭔가요?  교양있어 보이고 세련되게 들려서? 

 

브랜드 이름 정할 때는 내부 담당 직원들끼리 투표하지 마시고요, 실제로 사용할 고객들한테 물어보는게 좋다고 생각합니다. 몇 개의 후보들 중에서 뭐가 제일 좋은거 같냐고요. (혹시 이미 고객 서베이 결과로 '크레마 카르타'를 선택한거면은 제가 헛다리 짚은 거고요. 깨겡... ^^;)

 

 

제가 주제넘게 말이 길어졌네요.  ㅎㅎ

 

 

ps. 사족을 덧붙이자면,

11번가에서 '크레마 카르타' 커버로 1만원짜리 중국산 싸구려를 장만했더니 아주 가관입니다.  '크레마 카르타'의 전원 단추가 하단에 있는데요, 커버의 고정 밴드가 전원 단추를 가려버리고 있습니다.  만약 '크레마 카르타' 커버 디자이너가 "단 한번 만이라도" 자신이 디자인한 커버를 '크레마 카르타'에 사용을 해봤더라면 이처럼 어처구니없게 디자인 하지는 않았을텐데요. (1만원 짜리 싸구려 커버에 무얼 더 바라겠습니까만은... 에휴... -_-;)  혹시 전자책리더기 살 계획이 있는 분은 돈 좀 쓰더라도 정식 커버 사서 쓰시는거 권합니다.

 

 

("UX에 대한 기본이 안되어 있는 망할 놈의 디자이너 같으니라구"하면서 씩씩거리고 있는 저를 어여삐 여긴 와이프가 전원 위치의 커버 밴드를 왼쪽으로 살짝 옮겨서 바늘로 박음질을 새로 해줘서 지금은 잘 쓰고 있어요. 이자리를 빌어 와이프에게 다시 한번 감사를... ^^~♡  쏠로들에게는 심심한 위로를... -_-;)

 

 

전자책 리더기 살지 말지 고민하는 분이라면, "본전 뽑고도 남으니 사서 책 읽는 즐거움"을 만끽하시라고 권하고 싶습니다.  밤에 전기장판 틀어놓은 따끈따끈한 침대에서 백라이트 켜놓고 책 읽으면 무릎도 안시럽고 아주 좋아요. ㅎㅎ



##===================  2017.09.03 . 추가로 몇 자 적습니다 ==============##


2019.5월 달에 "리디북스가 한국 전자책 시장에서 제일 잘하고 있다"는 임정욱 스타트업 얼라이언스 센터장님께서 쓰신 글이 있네요. 


아무래도 이번 포스팅은 시장의 성적표로 평가해봤을 때 잘못 쓴 글이 되어버렸네요. ^^; 


리디북스 직원 150명 중 50명이 소프트웨어 개발자! 

로맨스·SF·판타지·BL 등 장르물에 선택과 집중!


역시 1등은 뭔가가 있어요. 리디북스, 정말 대단합니다!  

전자책시장 평정한 리디북스의 비결은?…‘압도적 수준의 가독성’

임정욱 스타트업 얼라이언스 센터장2017년 05월호


http://eiec.kdi.re.kr/publish/nara/column/view.jsp?idx=11021

Posted by R Friend R_Friend

댓글을 달아 주세요

최근 삼성의 갤럭시노트7 폭발과 리콜, "배터리 불량이 폭발의인"이라는 1차 분석(--> 결과론적으로 잘못된, 섣부른 불량원인 분석 결과 발표, 조치였음....)과 중국산 배터리로 교체 후의 재 판매, 그리고 재 폭발... 결국 생산 중단과 환불에 이른 일련의 다사다난했던 사건들이 있었습니다. 

 

삼성전자 엔지니어들이 아직 불량원인을 파악하지 못했고, 폭발을 재연을 못하고 있다고 하니 "폭발의 참 원인(Root cause)'을 찾는 것이 얼마나 어려운 일인지, 또 얼마나 중요한 일인지 다시금 생각해보게 됩니다.

 

삼성의 엔지니어들이라면 우리나라 최고 실력자, 전문가 집단일텐데요, 아직도 불량원인을 파악하지 못한 것을 보면 불량원인이 표면적인 원인, 1차원적인 원인이 아니기 때문이지 않을까요? 

 

좀더 얇아진 스마트폰 속에, 더 커진 배터리를 집어넣고, 방수처리를 했으며, 홍채 인식 등 연산이 많이 필요한 애플리케이션도 추가되고... 여러가지 요인들이, 스마트폰을 사용하는 다양한 상황, 순서, 흐름 속에서 서로 상승작용을 일으키면서 어느 순간 임계점을 넘으면... 그때 드디어 "배터리"가 폭발하지 않았을까요? 

 

제일 마지막 단계의 결과, 현상인 "배터리"만 쳐다보기보다는, 폭발에 이르게된 연결고리를 찾아야 폭발 사고를 연구실에서 '재연'할 수 있지 않을까요? 

(저는 엔지니어가 아니므로 폭발 원인 모릅니다.  모르니깐 자꾸 물음표만 남발을... -_-;;;) 

 

 

 

분석전문가의 역할, 역량에 대해서 말할 때 여러가지가 있겠습니다만은, 저는 "좋은 질문을 잘 던지는 능력", "(데이터를 가지고 풀어야 할) 문제를 정확하게 정의하는 능력" 첫번째로 꼽고 싶습니다.  그리고 오늘 포스팅의 주제는 "좋은 질문"을 한번도 아니고 5번이나 꼬리에 꼬리를 물고 던지는 기법인 "5 Why?"에 대한 이야기입니다.

 

 

 

 

 

 

문제의 원인을 제대로 찾지 못하면 제대로 된 해결책을 찾지 못하는 것은 당연한 결과이겠지요.  "기계가 멈춘 문제"에 대해서 "5 Why?"를 적용해본 예시를 가지고 참원인(Root Cause)까지 도달하지 못했을 때 어떻게 잘못된 대응방안이 도출되는지 살펴보겠습니다.

 

 

* 출처 : http://www.slideshare.net/aakashkulkarni3/9akk105151d0113-5-whys

 

 

 

> Problem : 기계가 멈추었다.

 

> 5 why?

 

 Why?

Questions (5 why?) 

Answer 

Action Item

 1st why?

 왜 기계가 멈추었을까?

과부하가 걸려 퓨즈가 나갔다

 ☞ 퓨즈 교환 

 2nd why?

 왜 과부하가 걸렸을까?

축에 윤활유가 충분하지 않았다

 ☞ 윤활유 보충 

 3rd why?

 왜 윤활유가 충분하지

않았을까?

윤활 펌프가 잘 작동하지 않았다

 ☞ 윤활 펌프 교체

 4th why?

 왜 윤활 펌프가 잘

작동하지 않았을까?

펌프 축이 마모되어 흡입력이

떨어졌다

 ☞ 펌프 축 수리

 5th why?

 왜 펌프 축이

마모되었을까?

여과기가 붙어 있지 않아서

절삭 칩이 들어갔다 

 ☞ 여과기 교체

 

 

 

위의 5 why? 사례에서 보듯이 왜라는 질문(question, why?)에 깊이, 수준에 따라서 답(answer)이 달라지고, 답에 따라서 대응방안(action item)이 현격히 달라집니다.

 

5 why?의 시작단계에서 질문을 끝마치고 피상적인 대응방안을 수립할 경우 그 문제는 반드시 '재발'할 것입니다.  문제를 발본색원하려면 근본원인, 참원인(root cause)를 찾아야겠지요.

 

 

 

5 Why? 관련해서 미국 토머스 제퍼슨 기념관 사례도 재미있어서 소개합니다.  토머스 제퍼슨 기념관의 외벽을 계속 페인트칠 해도 다시 부식이 되곤 하더랍니다. 그래서 기념관장이 직원에게 "Why?"를 다섯번 물어보았다고 해요.  

 

기념관장 : "왜 대리석들이 빨리 부식될까요?"

 

직원 : "대리석을 비눗물로 자주 씻기 때문입니다"

 

 

기념관장 : "그럼 왜 비눗물로 자주 씻는가요?"

 

 

 

직원 : "비둘기 배설물 때문에 비눗물로 자주 씻기 때문입니다"

 

 

기념과장 : "그러면 왜 비둘기들이 많이 올까요?"

 

직원 : "그야 비둘기의 먹이인 거미가 많이 오기 때문이지요."

 

 

기념관장 : "음...그러면 왜 거미들이 많이 오는거지요?"

 

직원 : "그거야 거미들의 먹이인 나방이 많이 오기 때문이지요"

 

 

기념관장 : "아하, 그럼 왜 나방은 몰려드는 거지요?"

 

직원 : (지친 목소리로??? ^^;;;) "실내 전등을 주변보다 더 일찍 켜기 때문이지요."

 

 

기념관장은 "나방이 몰려드는 시간을 피해 2시간 늦게 조명을 켜는 조치"를 취했다고 하는군요!   기념관 외벽에 페인트칠을 하는 횟수가 줄었을것 같지요?! ^^

 

단, 한국에서 상호간에 신뢰가 쌓이지 않은 상태에서 "왜?"를 5번씩이나 동일 인물에게 던질 경우 "당신 나한테 왜 그래?  무슨 감정 있어?"라는 반응과 함께 멱살을 잡힐 수도 있으니 눈치껏, 요령껏 질문을 던지시길...^^; 

 

반응적 경청!  눈 맞추고, 고개 끄덕 끄덕 해주고, 맞장구도 쳐가면서... 참원인에 도달하기 위한 꼬리에 꼬리를 무는 질문을 던지시길...!!!  4번, 3번, 2번만에라도 참원인을 찾으면 좋고요. Good luck!

 

 

 

참고로, 불량원인분석을 할 때 "5 Why?" 기법 말고도요, 일본의 품질관리 통계학 박사인 카오루 이시카와 박사가 개발한 "생선뼈 다이어그램(Fish bone diagram)"도 많이 사용됩니다.  아래에 예시가 있는데요, working conditions, raw materials, management, tchnology, machine, workers 의 관점에서 체계적으로 문제의 참원인을 탐색해나가는데 있어 유용한 방법론이라고 하겠습니다.

 

 

* 그림 출처 : http://www.conceptdraw.com/How-To-Guide/picture/Fishbone-Causes-of-low-quality-output.png

 

 

 

분석가가 통계기법, 기계학습 이론만 잘 안다고 해서 불량원인 분석을 잘할거라고 생각할 수는 없습니다. 재료/부품, 제품설계, 생산 프로세스, 생산 장비/설비의 변경점, 고객의 제품 사용 상황(특히, 사고 나기 직전 1~2시간 전에 제품가지고 무얼하고 있었는지, 어떤 징후같은게 없었는지...)을 이해하고 있어야 하고, 잘 이해하려면 좋은 질문을 던질 줄 알아야 하고, 잘 관찰해야 하고, 잘 경청해야 한는 점을 다시 한번 강조하면서 이번 포스팅을 마칠까 합니다.

 

 

그나저나 제 와이프도 갤럭시노트7 예약주문해서 구매했다가 아직 환불 안하고 가지고 있는데요, 무얼로 바꾸어야 할지 고민이네요.... 

 

Posted by R Friend R_Friend

댓글을 달아 주세요

  1. chemica 2016.10.22 22:46 신고  댓글주소  수정/삭제  댓글쓰기

    잘 보고 갑니다 ...

  2. 갤노트7 유저 2016.10.23 12:53  댓글주소  수정/삭제  댓글쓰기

    재미있게 잘 봤어요.

    전화위복이 되기위환 삼성의 갤노트7 환불교환 마케팅 방법은? .. 이런글도 한번 써보세요~ 갤노트7 유저로 요즘 영 맘이 오락가락 입니다. 바꾸긴 해야하는데 뭘로 바꾸나...

  3. 궁금해요 2016.11.02 13:52  댓글주소  수정/삭제  댓글쓰기

    좋은글 잘보고 갑니다.

  4. 재밌는 글입니다. 2016.11.17 16:27  댓글주소  수정/삭제  댓글쓰기

    재밌습니다.

사람의 행동을, 조직의 문화를 바꾸고 싶은 분이라면 반드시 맞닥뜨리게 되는 주제가 있습니다.

 

바로 "평가와 보상체계" 입니다.  경제학자들도 주목하는 주제이고, 경영자들과 관리자들도 매년, 매월 고민하는 주제입니다.

 

이는 사실 '인과관계'가 너무 복잡하게 얽혀있기도 하고, 사람의 심리와 관련이 있기도 해서 이번 블로그를 통해 이 주제를 깊이 다룬다는 것은 불가능합니다.(제가 이 주제를 다룰 만큼 내공을 가지고 있지 않습니다  ^^;)

 

다만, 왜 '평가와 보상체계가 중요한가?'에 대해서 한번쯤 고민해볼 수 있는 재미있는 사례들을 몇 개 모아보았습니다.

 

 

 

 

 

먼저 Dell社의 고객 서비스 부서에서 있었던 '잘못된 평가체계' 사례입니다.  측정하기 쉬운 '양적인 지표'에 매몰될 경우 불러올 '질적인 재앙'에 대한 내용입니다.

 

"델은 고객서비스 담당 직원들에게 하루에 처리한 전화 응대 건수에 근거해서 보상을 하기로 결정했다. 그러자 문제가 생긴 고객이 상담원과 통화하기 위해 몇 번씩 다시 전화를 하게 되는 상황이 발생했고, 통상 대기 시간이 30분 가까이 걸리게 되었다.


(중략)  게이트웨이는 고객 상담원들의 임금을 하루에 처리한 콜 건수에 따라 지불했다. 고객서비스 처리에 긴 시간을 소비한 상담원들은 그들에게 상여금이 지급되지 않자 고객의 전화를 빨리 끊는 방법을 연구하기 시작했다. 전화선이 이상한 것처럼 가장하기도 하고, 심지어는 큰 비용이 소요되는데도 아예 그냥 새 부품이나 컴퓨터를 보내주기도 했다. 결국 한때 업계 최고 수준이던 게이트웨이의 소비자 만족도는 평균 이하로 떨어졌고, 설상가상으로 많은 고객들이 친구나 가족들에게 게이트웨이를 이용하지 말라고 했다. 친구나 가족 등의 추천을 통한 매출은 한때 총매출대비 50퍼센트에 이르렀으나 이후 30퍼센트 내외로 떨어졌다."


(*출처: 마케팅 집중 강의, 윌렘 버거스 지음, 윤성호 옮김, 미래의 창)

 

(*그림출처: http://pann.news.nate.com/info/250408578)

 

 

 

"평가와 보상체계"가 만들어지고 announce 가 되고 나면, 이를 악용하려는 사람, 조직, 고객이 꼭 생기게 마련이지요.  '소잃고 외양간 고치기'하지 않으려면 '평가와 보상체계'에 대해서는 신중하게, 다시 한번 꼼꼼하게 (악용하려는 사람을 염두에 두고) 보수적으로 검토해볼 일입니다. '쥐를 사육'하는 민간 기업, 기발하지요? ㅋㅋ

 

"인도 정부가 쥐 가죽을 가져오는 사람에게 포상금을 지급하자 민간 기업들이 쥐를 사육하였다."


(*출처: 당근과 채찍, 이언 에어즈 지음, 이종호.김인수 옮김, 리더스북)

 

 

 

 

 

"평가와 보상체계"라는 것이 항상 비용이 많이 드는 것만은 아닙니다.  반대로, 어떻게 "평가와 보상체계"를 짜느냐에 따라서 비용 대비 효과가 어마어마하게 차이가 날 수 있습니다.  예전에 "넛지(Nudge)"라는 책이 회자되던 때가 있었는데요, 조그마한 "평가와 보상체계"의 변화가 큰 Output의 변화를 이끌어 낼 수 있다는 점이 매력적입니다. 영국에서 호주로 호송되던 죄수는 영국의 어느 관료가 앞으로는 '살아서 도착한 죄수의 수'에 따라 호송비를 지급하겠다'고 보상정책을 바꿈에 따라 목숨을 살렸을 테고, 그 자손들이 현재 호주에 여럿 살고 있겠지요?

 

"영국이 1788년부터 식민지였던 호주로 죄수를 호송할 때 일이다. 호주까지 무려 25,000킬로미터를 호송하는 동안 사망자가 너무 많았다. 심지어 한 호송선은 죄수 424명 중 158명(37.3%)이나 사망해 비난 여론이 들끓었다.
영국 정부는 죄소들의 생존율을 높이기 위해 식량과 의약품을 더 공급했다. 그러자 선장들이 중간에 착복해 호송 비용만 더 불어났다. 호송선마다 감시관을 파견해도 나아지는 것이 없었다.
영국 정부는 고민 끝에 묘안을 찾아냈다. 선장에게 지급하는 호송비 계산 방법을 단순히 죄수 숫자가 아니라 '살아서 도착한 죄수' 숫자를 기준으로 하도록 살짝 바꾼 것이다.
그러자 선장들은 정부가 시키지 않아도 죄수들 건강에 신경을 썼다. 그 결과 1973년 422명을 호송하는 동안 사망자는 단 1명 뿐이었다. 큰 비용이나 규제, 감시 없이도 선장의 욕심을 이용해 원하는 목적을 달성한 것이다.

(*출처 : 경제학, 인문의 경계를 넘나들다, 오형규 지음, 한국문학사)

 

 

 

 

 

보상 혹은 처벌 체계가 참 미묘합니다. 사람의 심리에 대한 근본적인 이해가 없이 1차원적으로 if xxx then xxx 식으로 보상 혹은 처벌을 하게 되면 자칫 의도치 않은 부작용을 초래할 수 있습니다.  따라서 제대로된 기획도 중요하고, 지속적인 평가와 피드백(소기의 목적대로 제대로 작동하고 있는가?) 도 중요합니다.  아래의 이스라엘의 어느 어린이집에서 있었던 '처벌'의 부작용 사례를 보시지요.

 

 실험의 첫 4주 동안 경제학자들은 학부모 중에서 몇 명이나 늦게 도착하는지를 기록했다. 그리고 다섯번째 주가 시작되기 전에 탁아소의 양해하에 다름의 안내문을 고지했다.

 

[공지사항] 지각할 경우 벌금이 부과됩니다. 탁아소의 공식 폐원 시간은 16시입니다. 우리는 (이스라엘의 사설 탁아소당국의 승인으로) 자녀를 폐원 시간 이후에 데리러 오는 학부모에게 벌금을 부과하기로 결정했습니다.

 다음 일요일을 기해서 16시 10분 이후에 아이를 데리가는 경우 NS10이 부과됩니다. 이 벌금은 월 단위로 계산되며, 정기 교육비와 함께 매달 지불되어야 합니다.

                                                                                       - 탁아소 관리인 알림

 

 그니지와 루스티치는 이 벌칙금 배후에 "어떤 행위에 대해 부정적인 결과가 발생할 경우 그 특정 반응은 감소될 것이다"라는 이론이 함축되어 있다고 말한다. 다시 말해서 범칙금이라는 좌절 요인이 생기면 학부모가 탁아소에 늦게 도착하는 일이 생기지 않을 것이다.

 그러나 실험결과는 딴판이었다. "벌금이 도입된 후에 늦게 오는 학부모의 수가 꾸준히 늘어났다. 마침내 일정비율이 고정되었는데, 그 비율은 벌금이 도입되기 전보다 훨씬 높았으며 구체적으로 거의 두 배에 달했다"고 연구자들은 보고한다.

 해리 할로우가 머리를 긁적였던 것처럼 이들도 기존 연구로는 이 결과를 설명할 수 없었다. 사실 "처벌받을 행동이 증가할 수 있다는 가능성은 아예 고려의 대상도 아니었다."

 

(* 출처 : 드라이브 (Drive), 창조적인 사람들을 움직이는 자발적 동기부여의 힘, 다이엘 핑크 지음, 청림출판)

 

 

 

국내에서는 대부분의 회사가 '상대평가'를 적용하고 있습니다.  3~5개 정도의 등급으로 구분하고, 각 등급별로 강제로 구성비율을 할당하게끔 해놓았으며, 조직별, 또 개인별로 그 등급 비율에 맞게 상대적으로 평가를 해야만 하는 구조입니다.  이런 평가/보상 체계 하에서는 '조직 간 원활한 협업', '정보공유와 커뮤니케이션'이 일어날 것이라고 기대하기가 힘들어집니다.  ('조직 간 협업' 지표를 평가지표로 추가하는 묘수가 있다고요????) 

 

회사 다니는 분들은 피부로 느끼실 것 같습니다. 그쵸? 

 

 

애덤 그랜트가 지은 'GIVE and TAKE' (부제 : 주는 사람이 성공한다) 책에 보면 '개인'과 '조직/팀' 평가와 보상에 관해 생각할 거리를 던져주는 2가지 연구 결과가 있습니다.  하나는 병원 외과의사, 또 하나는 투자자문기관 증권 분석가 사례인데요, 좀 길지만 아주 인상깊은 사례이기에 전체 내용 소개합니다.

 

[ (1) 외과의사 사례 ]

 

 연구를 진행한 로버트 허크먼과 개리 피사노 교수는 외과 전문의가 수술 경험을 통해 더 나아질 수 있는지 조사했다. 미국의 경우 외과의사는 보통 여러 병원에서 시술한다. 허크먼과 피사노는 심장외과 전문의 203명이 각기 다른 마흔 세 개 병원에서 2년간 집도한 수술 3만 8,577건을 추적 조사했다. 이때 연구진은 환자 중 평균 3퍼센트가 수술 중에 사망하는 관상동맥우회로 이식술에 초점을 맞췄다.

 자료를 분석한 허크먼과 피사노는 놀라운 패턴을 발견했다. 전체적으로 외과 전문의는 수술을 거듭해도 실력이 나아지지 않았고, 자신이 근무하는 '특정 병원'에서 시술할 때만 더 좋은 결과를 냈다. 자신이 근무하는 병원에서 시술하면 환자의 사망률이 1퍼센트 떨어졌지만, 다른 병원에서 시술하면 사망률이 원래대로 돌아갔다. 다른 병원에서는 의사들이 제 실력을 발휘하지 못했다는 얘기다. 그렇다고 자신이 근무하는 병원에서 의사들의 관상동맥우회로 이식술 실력이 나아지는 것은 아니다. 다만 자신의 강점과 약점, 습관 및 수술 방식을 잘 아는 간호사나 마취과 의사들과 함께할 때 더 익숙하게 솜씨를 발휘할 뿐이다. 환자의 생명을 구하는 그 익숙함은 다른 병원으로 가져갈 수 없다. 결론적으로 말해 환자의 사망률을 낮추려면 외과의사가 수술팀과 밀접한 관계를 맺어야 한다.

 

 

[ (2) 투자자문기관 증권 분석가 사례 ]

 

  허크먼과 피사노가 병원 자료를 수집하느 ㄴ동안 하버드대학의 한편에서는 금융 분야에서 비슷한 연구를 진행했다. 투자은행에서 일한ㄴ 증권 분석가는 수익을 예측하고 특정 회사의 주식 매수 전략을 금융회사에 조언한다. 스타 분석가는 누구와 함께 일하느냐와 관계없이 자기 뜻대로 능력을 발휘할 만한 뛰어난 지식과 전문기술을 갖추고 있다는 것이 일반적인 생각이다.

(...중략...)

 보리스 그로이스버그는 이 가정을 확인하기 위해 9년 동안 서로 다른 일흔여덟 개 회사에서 일한 주식 및 고정수익증권 분석가 1,000명 이상을 조사했다. (...중략...) 그로이스버그 연구팀은 분석가가 회사를 옮겼을 때 실적이 어떻게 변하는지 추적했다.

  흔히 스타 분석가는 자신의 능력만으로 그 자리에 올랐다고 생각하지만, 연구 결과 실적은 갖고 다닐 수 있는게 아니었다. 스타 분석가가 다른 회사로 옮기면 실적이 떨어지고 최소 5년 이상 그 상태에 머물렀다. 이직 첫해에 1위를 차지할 확률은 5퍼센트 줄었고, 2위를 차지할 확률은 6퍼센트 낮아졌으며, 3위를 기록할 확률도 1퍼센트 떨어졌다. 반대로 순위에 들지 못할 확률은 6퍼센트 상승했다. (...중략...)  그로이스버그 연구팀은 프렌켈이나 업계 관계자가 믿는 것과 달리 "스타 분석가를 고용하는 것은 분석가의 실적으로 보든 회사의 시장 가치로 보든 좋은 게 없다"는 결론을 내렸다.

 단, 어떤 스타 분석가는 회사를 옮기고도 계속해서 성공가도를 달렸다. 그들은 자기 팀과 함께 회사를 옮겼다!

 

* 출처 : 'GIVE and TAKE' (주는 사람이 성공한다), Adam M. Grant, 2013

 

 

'스타 플레이어', '하이 퍼포머'에 대해서 '자기 혼자 잘나서 그런 것인가? 아니면 팀플의 위력인가?'에 대해서 생각해보게 됩니다.

 

 

 

평가와 보상체계가 '국민'들의 행동도 바꿀 수 있을까요?  '선거 투표'에 대한 유시민 전 장관의 '복권' 아이디어가 재미있으면서도 실제 적용하면 효과가 있을 것 같기도 해서 인용해봅니다.  '투표도 하고, 복권 당첨 기대도 하고...도랑치고 가재 잡는' 아이디어인거 같은데요, 이거 당장 내년 대선에 도입해보면 좋겠습니다. ^^

 

* 이미지 출처 : http://news01.jtbc.co.kr/article/article.aspx?news_id=NB11209612

 

 

* 이미지 출처 : http://news01.jtbc.co.kr/article/article.aspx?news_id=NB11209612

 

 

평가와 보상체계 관련해서 재미있는 사례 몇개 모아보았습니다.

 

어떻습니까? 차분히 생각해볼만한 값어치기 있는 주제같지요?! ^^

 

Posted by R Friend R_Friend

댓글을 달아 주세요

  1. DGDA 2016.08.13 21:23  댓글주소  수정/삭제  댓글쓰기

    정말 많은 도움이 되었습니다. 위 게시글 외에도 정말 유익한 글들이 많네요. 좋은 지식 공유해주셔서 감사합니다 !!!

야구 좋아하시나요?  4월 1일날 프로야구가 개막을 했습니다.

 

퇴근 길에 야구 & 빅데이터 관련한 신문기사 제목이 눈에 띄길레 봤더니 내용이 '이렇게 분석을 해도 되나?' 싶은게 있어서 몇 자 적어봅니다. 

 

 

오늘 포스팅의 대상으로 삼는 뉴스는 아래의 연합뉴스 2016.04.04일자 기사 입니다.

 

 

 

빅데이터로 본 '프로야구 5강'…한화·삼성·SK·두산·KIA

 

다음소프트, SNS 언급량과 경제·실력변수 분석해 예측

 

빅데이터 분석업체 다음소프트는 지난달초부터 28일까지 사회관계서비스망(SNS)상 각 팀의 언급량과 경제·실력 변수 등 3가지 요소를 조합해 '2016 KBO리그 5강'을 예측한 결과를 4일 발표했다.

순위 예측에 사용된 SNS변수는 지역·팀 이름과 치킨 언급량을 조합했다. 경제변수는 구단이 속한 기업의 시가총액과 구단의 평균 연봉을 조합했고, 실력변수는 지난해 KBO 정규리그 경기 결과를 토대로 계산된 구단별 타자율과 방어율을 고려했다. 이들 세가지 변수는 각각 가중치에 따라 최종적으로 지수화됐다.

 

 

 

 

* 원문 링크: http://www.yonhapnews.co.kr/bulletin/2016/04/03/0200000000AKR20160403056900033.HTML

 

 

원문은 위의 링크를 참조하시기 바랍니다. 

 

신문기사 보고 나서 생각해봤던 것들을 적어보겠습니다.

 

 

1) 상관관계(correlation) vs. 인과관계(causation)

 

먼저, 상관관계는 인과관계가 아니다는 것부터 시작해보죠. 다음소프트에서는 분석을 할 때 SNS, 경제, 실력변수를 2014년, 2015년 실제 승률과의 상관관계를 검증해서 선정했다고 했네요.

 

최재원 다음소프트 이사는 "순위 예측에 사용된 SNS·경제·실력 변수는 2014년과 2015년의 실제 승률과 상관관계를 검증해 선정됐다"고 설명했다.

 

미국닭고기협회(NCC)는 올해 미국프로풋볼리그(NFL) 플레이오프에서 미국인의 대표 간식인 '버팔로윙'(닭날개)이 많이 팔린 도시의 팀이 좋은 성적을 거뒀다는 자료를 소개했다. 올해 플레이오프 10경기에서 상대 팀보다 닭날개 판매 실적이 더 높은 도시의 7개 NFL팀이 승리를 거뒀다는 것이다.

다음소프트는 이같은 '닭날개 가설'을 한국 프로야구에 적용했다. 각 구단의 홈 지역이나 구장, 팀이름이 '치킨'과 함께 언급된 SNS 데이터를 최근 2년간 승률과 비교했다. 결과적으로 치킨 언급량과 승률의 상관관계는 0.3으로, 사회학적으로 '약한 상관관계'가 있는 것으로 나타났다

 

"상관관계가 있다"고 할 때 대비 "인과관계가 있다"라고 말할 수 있으려면 "시간의 선 -> 후" 관계가 있고, 원인과 결과의 "방향"이 있어야 합니다. 

 

제가 보기에 치킨 언급량은 시간의 선/후가 뒤바뀌고 원인과 결과가 뒤바뀐 자료 같아 보이는데요.  치킨을 많이 먹어서 경기를 이기는게 아니라, 경기를 이기니깐 치킨을 많이 먹는거 아닌가 하구요.  상관관계 0.3이라면  의미가 있다고 할 수 있나요?

 

 

아래의 글에서도 보면 분석 결과 "공공의 적 햄버거, 패스트푸드가 비행청소년을 만든다"는 주장인데요, 제가 보기에는 그 반대의 설명, 즉 "가정형편이 어렵고 부모로부터 제대로된 보살핌을 못받은 비행청소년들이 먹을 수 있는 음식이 패스트푸드 위주일 수밖에 없는거 아닌가" 싶기도 합니다.  상관관계를 인과관계로 쉽사리 예단하기가 그리 간단하고 쉽지 않다는 것입니다.

 

“한국청소년연구소(이사장 박명윤·보건학 박사)가 2000년 11월 조사한 '비행청소년의 식생활에 관한 연구'를 보면 라면, 햄버거, 피자, 탄산음료 등 인스턴트 음식의 섭취량에서 일반청소년과 비행청소년들 사이에 상당한 차이가 있는 것으로 드러났다.
즉 비행청소년들은 일반 청소년들에 비해 이와 같은 음식물을 2배 가량 많이 섭취하고 있었다. 박명윤 이사장은 “대량의 카페인, 당분, 방부제, 향료, 인공 착색료 등이 들어 있는 음식을 '정크 푸드'라고 하는데 특히 어린이들의 경우 이런 인공물질에 대한
신체 저항력이 불완전하므로 지속적으로 그런 음식을 섭취하면 주의력이 흩어지고, 욕구불만이 쌓여 폭력행동으로 나타날 가능성이 있다”고 지적했다.”

 

- 주간동아 제345호 '공/공/의/적/햄/버/거' 중에서 -

 

 

이런 예도 있습니다. 2012년 미국 콜롬비아 대학의 프란츠 H 메저리(Franz H. Messerli) 박사가 의학분야 최고 수준의 저널인 뉴 잉글랜드 의학 저널(New England Journal of Medicine·NEJM)에 전 세계의 주요 국가의 100만명 당 연간 초콜릿 소비량과 노벨상 수상자 수와의 상관관계 분석에 대한 결과의 논문을 발표하였습니다. 그리고 아래처럼 인상적인 산포도를 보여주었습니다.  

 

 

(* 출처 논문 보러가기 ☞ http://www.biostat.jhsph.edu/courses/bio621/misc/Chocolate%20consumption%20cognitive%20function%20and%20nobel%20laurates%20(NEJM).pdf ) 

 

 

위 그래프는 Franz H. Messerli, M.D., "Chocolate Consumption, Cognitive Function, and Nobel Laureates", 2012, 논문에 실린 산포도 그래프인데요, 결론을 이렇게 냈습니다.

 

There was a close, significant linear correlation (r = 0.791, P<0.0001) between chocolate consumption per capita and the number of Nobel laureates per 10 million persons in a total of 23 countries (Fig. 1).

 

초코렛 소비량과 노벨상 수상자 간의 상관계수가 0.79 로서 매우 강한 상관관계가 나왔다고 결론을 내고 있습니다.  그런데 말입니다, 소득수준이라는 제 3의 교란요인(confounding factor)가 있는건 아닐까요?   

초코렛 소비량과 노벨상 수상자 수 간에 높은 상관관계가 있는 것은 맞습니다.  하지만 이게 '초코렛 소비량이 많으면 (다른 말로 하자면 '초코렛 소비량을 늘리면') 노벨상 수상자가 많아진다'는 인과관계로 확대해석 하는 것은 주의를 요합니다. 

 

도시별 '경찰관의 수'와 '도둑놈의 수'는 강한 상관관계를 가집니다.  그렇다고 '도둑놈이 많은 이유(원인)이 경찰관이 많아서' 인가요?  중간에 '인구 수'라는 제 3의 교란요인이 숨어있다고 보는게 맞지 않겠습니까?

 

 

 


여러분 생각은 어떠세요?  치킨 언급이 많다고 승률이 올라가는게 타당하다고 보시나요?

 

 

 

 

2) 실험군 vs. 대조군

 

보통 분석을 할 때 보면 대조군(control group)이라고 해서 비교의 대상, 분석 정확도의 향상 정도를 판단할 수 있는 기준을 둡니다.

 

"각 구단의 홈 지역이나 구장, 팀이름이 '치킨'과 함께 언급된 SNS 데이터를 최근 2년간 승률과 비교했다"라고 했는데요, 그럼 '각 구간의 홈 지역이나 구장, 팀이름만 나오고 치킨이라는 말이 안들어 갔을 때'의 승률과의 상관관계(대조군)는 어떠했을지 궁금하네요.

 

대조군 없는 분석은 과학이라기 보다는... 그냥 우연이었을 가능성을 배제할 수 없습니다.

 

 

그리고 분석의 성과(performance) 얘기할 때 보통 '눈감고 찍었을 때 보다 xx배 예측/분류 정확도 증가' 이런식으로 나타내곤 하는데요, 혹시 지나가는 사람 아무나 10명 붙잡고 '올해 어느 팀이 우승할 거 같나요?'라고 물어보고나서 야구팀 올해 성적 순위를 매긴 것하고 비교했을 때 예측 정확도가 우월하지 않고 시원치 않다면, 비슷비슷 하다면 굳이 빅데이터 분석한다고 난리를 피울 값어치가 있나 싶기도 합니다. 2년치 SNS 분석? 음....

 

(옆으로 좀 세보자면, SNS 분석에서 대상으로 삼는 온라인 상의 데이터는 모집단을 대표하는 샘플이라고 말할 수 없습니다. Daum의 댓글들만 보면 새누리당은 다음주 4.13 선거에서 폭망할 것 같지만 댓글 안다는 노인분들은 새누리당 묻지마 지지거등요. 샘플이 모집단을 대표하지 못하기 때문입니다.  분석결과 해석도 분석가 A가 하면 이렇게, 분석가 B가 하면 저렇게 해석할 여지가 많아서 이건 과학이 아니라 예술에 가깝다고 생각합니다. 재현가능성이 무척 낮기 때문에요.)

 

 

 

3) 과거 데이터로 검증, 미래 예측

 

"순위 예측에 사용된 SNS·경제·실력 변수는 2014년과 2015년의 실제 승률과 상관관계를 검증해 선정됐다"고 다음소프트에서 말했는데요, 모델을 만들었으면 과거 데이터를 가지고 모델에 적용했더니 적중률이 어떠했다고 말해주면 좋았겠다 싶습니다.  변수 상관관계 검증한거랑 모델의 정확도 검증한거랑은 다르잖아요.

 

과거 이력 데이터로 검증했을 때 통과했다고 칩시다. 문제는 미래를 얼마나 잘 예측하냐일텐데요. 

예측 모델이라는 것이 과거 데이터를 가지고 과거의 패턴, 추세 등이 지속된다는 가정 하에 만들어집니다.  그런데 만약 이 가정사항이 흔들리면 어떻게 될까요?

 

 

 

시사저널 2016.04.04일 기사에 보니 아래와 같은 내용이 있네요. 저는 야구는 안보는지라 사실 올해 KBO리그가 어떻게 돌아가는지 하나도 모릅니다. 다만 아래 기사를 보니 과거 데이터로 모델을 만들었을 때 조마조마하겠다는 느낌 아닌 느낌이 옵니다.

 

야구의 계절이 돌아왔다. 새로운 봄의 시작을 알리는 2016 KBO리그가 4월1일 개막전을 시작으로 각 팀마다 144경기를 치르게 된다. 올해 KBO리그에서는 스타 플레이어들의 해외 진출과 메이저리거 출신 외국인 선수 영입, FA 선수들의 이적으로 선수 구성이 바뀐 팀이 많다. 지난해 상위권 팀이 하위권으로 추락하고, 하위권이던 팀이 상위권에 입성하는 등 예년보다 순위 변화가 클 것으로 예상된다. 개막 첫날부터 시즌 마지막 날까지 결과를 예측할 수 없는 치열한 순위 다툼이 펼쳐질 것으로 기대를 모으고 있다.

 

* 출처 : http://www.sisapress.com/news/articleView.html?idxno=76538

 

 

 

 

4) 데이터, 빅데이터, 승률 예측

 

뭐, 그렇다고 데이터를 가지고 스포츠 승률 예측하는게 불가능하냐 하면 또 그렇지만도 않습니다.  스포츠에서는 이미 데이터 기반의 의사결정이 널리 쓰이고 있습니다.

 

브래드피트가 나왔던 영화 '머니볼' 보셨나요?  데이터를 가지고 선수 스카우트하는데 있어 "한정된(constraints) 예산으로 시장에서 저평가된 야구 선수를 스카우트해서 팀 승리 기여도를 최대(maximization)화 하여라"는 최적화 문제를 푸는 내용이 나오는 영화입니다.

 

 

 

 

('머니볼' 영화 속의) '오클랜드 애슬레틱스'의 단장 빌리 빈(브래트 피트)은 턱없이 부족한 예산으로 팀을 준우승으로 이끈 (실화에 바탕을 둔) 야구 영화입니다. 기존의 전통적인 스카웃터들이 사용한 다섯가지 지표가 "타격 파워", "타격 정확도", "주루 스피드", "송구 능력", "수비 능력"이었습니다.  그런데 (머니볼에 나오는) 예일대를 졸업한 젊고 계산에 능한 경제학자(조나 힐)의 분석 결과에 따르면 "출루율"이 승률 기여도에 매우 중요한 걸로 나왔어요. 남들이 무시하는 "출루율"을 가지고 선수들을 평가해보니 오클랜드 애슬레틱스는 "저평가"된 선