본문 바로가기

연재자료실

읽고 따라하는 통계학 (9~10장)

09_통계적 접근이란 무엇인가요?  

 

자 그럼 지금부터는 통계학에서 자주 인용하는 통계적 접근이라는 말을 한 번 살펴봅시다.

 

누군가 이 글을 읽는다면 그 목적은 통계 학자가 되고픈 건 아닐거에요.

 

통계학을 좀 알고 싶은데 너무 어려워서 여기 들어왔던가

 

논문이나 사회수요조사를 하기 위해 SPSS에서 필요한 기능만 쏙 빼서 배우고 싶다던가

 

엑셀로 통계 함수만 배워서 빨리 응용해 보고 싶다던가....

 

이런 마음이겠죠?

 

네 맞습니다. 통계적 접근이라는 것은 내가 어떤 목표를 세웠을 때

 

그 목표에 맞는 데이터를 수집, 분석, 활용하는 것을 말해요.

 

쉽게 말해봅시다.

 

우리가 운전할 때 자동차의 모든 기능을 배워서 궁금증을 해결한 뒤에 운전할까요?

 

절대 아니죠?

 

그냥 우리는 엑셀 밟고, 브레이크 밟고, 자동식으로 된 기아 만지고

 

사람죽이면 안된다는 것을 인식하고

 

교통법규를 지키기 위해 표지판이나 신호등 보는 법이나

 

베토벤의 '엘리제를 위하여'를 들으면서 안전하게 후진하는 것을

 

가장 우선적인 기능으로 생각합니다.

 

우리가 여기서 논하는 통계학도 같은 이유지요.

 

필요한 데이터만 뽑아서 그것을 분석하는 기술을 배우고 활용하는 것....

 

즉, 데이터 목표설계 - 데이터 수집 - (빅데이터일 경우) 카테고리 정리 - 분석 - 활용....

 

이렇게 필요한 것만 뽑아서 목표를 이루는 방식이 통계적 접근이랍니다.

 

저 역시 이 방법들을 설명할 뿐 학문적 접근은 뭐.... 그냥 용어 설명 정도만 할꺼에요.

 

 

10_통계적 접근은 언제부터 했던 것일까요?  

 

그럼 이러한 데이터를 설계하고 수집하는 것을 누가 먼저 시도했을까요?

 

보통 우리는 통계학 하면 무슨 통계학의 아버지... 등을 생각할텐데...

 

그건 근현대적 개념이구요.

 

원래 통계학이란, 국가의 생존을 결정하기 위해 사용하던 방법이랍니다.

 

국가에서 의도적으로 장려했든... 모르고 사용했던지 간에 말이죠.

 

예를 들어 봅시다.

 

우리는 보통 역사 시대 이후, 즉 청동기든 철기든 국가가 형성된 이후로

 

중앙집권적 국가에서는 항상 자국민의 분포와 세금 확보를 연구했답니다.

 

그 때 활용해야 하는 필수적 방법이 인구나 영토, 식량을

 

더하고 곱하고 평균내는 기술통계학이죠.

 

원래 통계학이란 단어를 뜻하는 STATISTICS란 단어도 다음 두 단어를 합친 거랍니다.

 

국가(STATE) + 상황(STATUS) = 국가의 상황을 파악하는 것...

 

즉, 어떤 국가든 자국을 보호하기 위해서는 여러 상황에 대비해야 하고 그 때 활용되는 학문이

 

바로 국가상황학 = 통계학인 것이죠.

 

예를 들어서 수나라 양제가 100만 대군을 이끌고, 고구려와 전쟁을 한다고 해볼께요.

 

자, 100만 대군이 3천킬로를 이동할 때 하루에 얼마나 이동해야 하며,

 

그 때 100만명이 하루 3끼를 먹으려면 군수물자가 얼마나 필요하며,

 

100만명을 먹여살기기 위해 취사병과 음료는 얼마나 필요하며,

 

그 군수용품을 운반하기 위해 말과 마차는 얼마나 필요할까요?

 

저 같으면 머리 아파서 전쟁을 안하고 말겠네요 ㅠㅠ

 

그리고 한가지 의문을 더 추가해 볼수도 있을 것입니다.

 

과연 그 시대에 100만명의 이동이 가능한 것인가? 통계적으로 뻥치는 것이 아닌가?

 

만약 군수품과 취사, 음료, 마차 등을 모두 고려할 때 당시 기술로 이동 가능한 최대 인력은

 

1000킬로당 10만명 수준이 아니였을까?.... 뭐 이런 통계를 통한 역사적 추론도 가능하겠죠?

 

어찌되었든 간에 결론은

 

국가는 항상 어떤 사건, 상황, 상태를 대비해서 사전 조사를 해야 합니다.

 

그게 전쟁일 수도 있지만, 질병, 징병, 농업수확량 등일 수도 있고

 

그것을 위해 더 근본적으로 인구, 세대수, 세대별 가족수와 생산활동 가능인구를 확보해야 합니다.

 

그러나 그것을 모두 알수는 없기에 지역별로 모집단에 대한 표본을 산출해서

 

대략적인 인구를 산출하게 됩니다.

 

이 때 자료를 제공하는 각 지역의 수령(도지사, 군수 등)이

 

중간에서 보고를 누락하고 삥땅치거나 탐관오리가 많다면

 

기초자료부터 오류가 생길 것이고

 

그렇다면 국왕은 잘못된 데이터를 가지고 국정을 운영하다가

 

성군이 아닌 '망군'이라는 소리를 듣고 나라가 망하게 되겠죠.

 

우리 고려나 조선은 500년 이상 버틴 왕조인데,

 

중국이나 일본은 왕조가 100~300년 이상 못가죠?

 

그 이유는 여러가지이지만 통계학적으로 보면 유의미한 통계가 있답니다.

 

중국은 영토가 넓고 황제체제가 굳건할수록 전성기 이후 왕조가 급격히 몰락하곤 합니다.

 

전성기 때 수확량이나 인구, 징병 데이터에 비해

 

그 이후 데이터는 오류가 많거나, 관리들의 태만으로 국가 운영에 차질이 많은 부분들이

 

누락되기 때문이죠.

 

일본은 지방봉건체제가 굳건해서 중앙정부가 전국통계데이터를 확보한 왕조가 거의 없답니다.

 

자, 그렇다면 국가 외에 개인적으로 통계학을 정립한 사람들은 없을까요?

 

다음 장에서는 유명한 인물 몇명을 토대로 통계학이 어떻게 활용되는지 한번 살펴보도록 할께요.

 


 

* 본 자료는 출간된 자료나 출간 예정 자료의 내용을 요약해서 읽기 쉽게 정리한 것입니다.

 

  연재자료실의 연재글과 통계 데이터는 타 게시물로 옮겨가시는 것을 불허합니다.