홈 > 도서정보 > 국내도서

도서정보

통계학 초 입문

통계학 초 입문

  • 도서 주제순수과학
  • 제 목통계학 초 입문
  • 저 자다카하시 요이치 다카하시 요이치
  • 출판사지상사
  • 출판일2020. 01. 03
  • ISBN9788965022893
  • 이용 대상일반
  • 가 격13,700 원
  • 수상 내역
  • 미디어
  • 기관 추천

도서 상세정보 바로가기

  • 도서 서평정보
  • 도서 목차정보
  • 도서 책소개
  • 도서 저자 및 역자소개

서평

우리는 아직 통계학의 문 앞에 있다.
수학 문제가 풀렸을 때 느끼는 짜릿한 쾌감이 좋다.
이 세상의 원리와 돈의 흐름, 사람들의 행동을 숫자와 공식으로 표현할 수 있다. 수학은 즐겁고 아름다운 분야다. 하지만 세상에는 수학을 싫어하는 사람이 많다. 공식을 보면 지레 겁을 먹고 숫자가 나열되면 ‘하나도 모르겠다’고 말한다. 그렇게 숫자를 싫어하는 사람들이 통계학에 대해 알고 싶을 때, 무엇을 어떻게 전하면 통계학 일부라도 알게 할 수 있을지 고민하면서 이 책을 썼다. 숫자를 보고 의욕을 잃지 않도록 공식을 이해할 수 없어서 통계학 배우기를 포기하지 않도록 정말 하나하나 곱씹어가며 설명했다. 독자 여러분의 정신을 어지럽히는 수학적 표현이나 기호도 최소한도로 기재했다. 이 책을 다 읽은 여러분은 지금 통계학이라는 학문의 문 앞에서 문고리를 잡고 서 있는 상황이다. 아직 우리는 입구에 있는 것이다. 그 문을 열면 미지의 세계를 예측하거나 아직 보이지 않는 미래를 상정할 수 있는 아름다운 세상이 펼쳐진다. 그러나 그 아름다움을 이해하려면 수학을 알아야 한다. 수학과 마주할 각오가 있다면, 그 문을 열고 들어가자. 좌절할 때도 많겠지만 그래도 얻는 것이 있을 것이다. 각오가 서지 않는다면 여기까지만 하자. 그래도 충분하다. 나는 ‘이유를 모르겠다’며 포기하는 것을 좋아하지 않는다. 하지만 수학만큼은 예외다. 모르는 사람은 모르기 때문이다. 수학은 어느 정도 재능이 필요한 분야이다. ‘모르겠다’는 현실을 받아들이는 것도 중요하다.

전부를 조사하지 않아도
전체상을 어느 정도 알 수 있다.
전수 조사를 하지 않아도 샘플 수가 많으면 실제 시청률을 알 수 있을까? 샘플 수만 충분하면 통계학을 이용해서 전체상을 완벽하게 파악할 수 있을까? 엄밀하게 말하자면 그렇지 않다. 샘플 조사와 전수 조사에는 아무리 해도 차이가 생기기 때문이다. 그 차이를 0으로 할 수는 없다. 그러나 통계학을 이용하면, “이 정도로 샘플을 모으면 실제 값과 ±1% 차이가 난다.” “이 정도로 샘플을 모으면 실제 값은 99% 범위 안에 들어간다.” 이 정도의 차를 알 수 있다.
다시 말해 전수 조사를 하지 않고 약간의 샘플 데이터만 있으면 전수 조사한 결과와 거의 비슷한 수치를 산출할 수 있다. 이것이 통계학이다. 그러면 한 번 생각해보자. 1800만 세대분의 데이터를 모은 경우와 겨우 900세대분만 모은 경우, 각기 계산해서 도출한 결과 값이 거의 같았다면? 1000세대를 조사한 경우와 900세대를 조사한 경우의 시청률 차이를 비교해봤더니 거의 차이가 없었다면? 굳이 돈과 노동력을 들여가며 방대한 데이터를 모을 필요가 없다. 그것은 낭비다. 통계학은 ‘이 낭비’를 깔끔하게 제거해준다.

공식은 외우지 않아도 된다.
그 대신 공식을 이해해야 한다.
히스토그램, 평균값, 분산, 표준편차, 정규분포, 이항분포, 중심극한정리……. 이 책에는 여러 가지 통계학 용어가 등장했지만, 그것을 외우지 못하겠으면 잊어버려도 된다. 사실 통계학, 나아가 수학 공식이나 용어는 일상생활과 전혀 상관이 없으므로 시간이 지나면 당연히 잊어버린다. 잊어버릴 줄 알면서도 그래도 외우려고 하는 사람은 내용을 이해하지 못하니까 통째로 외우려는 것뿐이다. 그 모습이 얼마나 어리석은지 깨닫지 못한다. 이것은 사실 생각하지 않는 행위나 마찬가지인데 말이다. 생각하는 능력은 기억력과 다르다. 기억은 시간이 지날수록 희미해지지만 생각은 우리가 살아있는 한 영구히 이어진다. 특히 수학적 사고는 보편적이고 우리 생활에 널리 적용할 수 있다. 수집한 데이터를 분석할 때 ‘분산’이라는 전문용어가 나오지 않아도, 공식을 잊어버렸어도, ‘평균에서 벗어난 데이터가 많으면 데이터는 들쭉날쭉 퍼진 모양이 된다’라고 이해하면 된다. 그것을 이해하면 ‘데이터와 평균값의 차이’가 데이터가 퍼진 정도를 생각할 때 필요한 요소라는 점도 알 수 있다. 생각하면 된다. 적어봐야 알 수 있다면, 적어보면 된다. 이 책에서 여러 번 ‘직접 써보면 된다’고 한 것은 종이에 적으면 이해할 수 있기 때문이다. 공식을 통째로 외우기 위해서가 아니다.
통계학은 ‘편향되지 않을 것’이 전제이다.

통계학은 적은 비용과 노동력으로 거의 정확한 전체상을 파악할 수 있다. 그런데 ‘거의 정확한’ 결과를 도출할 수 있는지는 샘플을 선택하는 방법에 달려 있다. 예를 들어 시청률 조사를 할 때, 그 집에서 사는 사람이 어느 방송을 보는지는 연령대나 가족 구성에 따라 다르기 마련이다. 그런데 샘플 대상을 20대 젊은이만 수집하거나 70대 이상인 고령자만 수집하면 편향된 결과가 나올 것이다. 즉, 샘플이 편향되면 정확한 결과를 낼 수 없다는 말이다. 그러므로 통계학자는 편향되지 않은 샘플을 추출하는 것을 무엇보다도 중시한다.

목차

프롤로그
‘통계학’이 뭐지? ―‘돈’과 ‘노동력’의 낭비를 막는다!

통계학에 대해 사람들이 ‘오해하는 것’
전부를 조사하지 않아도 전체상을 어느 정도 알 수 있다
통계학은 ‘편향되지 않을 것’이 전제
편향된 데이터가 필요할 때도 있다
무작위는 의외로 어렵다
과부족 없이 하기도 어렵다

1장 히스토그램, 평균값, 분산, 표준편차
―‘통계학’은 여기서부터 시작하자!

가장 대중적인 통계학 ‘히스토그램’
누구나 할 수 있는 주사위 히스토그램
‘도수’와 ‘계급값’이란 무엇인가
평균값, 분산을 계산해보자
통계학에서 ‘평균값’을 구하는 방법
데이터가 퍼진 상태를 나타내는 ‘분산’
직접적인 수치를 나타내는 표준편차
편찻값을 계산하는 방법을 알고 있나?
편찻값이 무엇일까?
편찻값을 계산해보자
표준편차로 편찻값이 오른다? 내린다?
단 한 번의 시험으로 학력을 측정할 수는 없다

2장 정규분포
―가장 대중적인 ‘분포의 왕’

‘정규분포’란 무엇일까?
좌우대칭의 산처럼 생긴 그래프
어떤 데이터가 정규분포를 그리는가
평균값과 분산이 중요한 이유
가우스가 증명한 표준정규분포
‘오차’란 무엇인가
표준정규분포는 왜 특별한가
데이터를 ‘정규화’한다
정규분포가 통계학을 수월하게 하는 이유
통계학은 먼저 ‘가정’을 한다

3장 이항분포
―세상의 ‘온갖 현상’이 여기에 있다

이항분포란 무엇인가?
이항분포는 확률분포의 일종이다
이항분포를 이해하기 위한 전제 ‘조합’
‘조합’과 ‘순열’을 알아보자
‘조합’이란?
순열이란?
조합은 ‘중복’, 순열은 ‘별개’라고 생각한다
수학은 공식을 몰라도 풀 수 있다
주사위를 이용해서 이항분포를 이해하자
베르누이 시행이란 무엇인가
여러 가지 값의 범위 ‘확률변수’
주사위로 해석하는 ‘이항분포’
이항분포 정리식을 이해하자

4장 정규분포와 이항분포
―중요한 아 두 분포는 어떤 관계인가?

통째로 외우면 좋은 ‘중심극한정리’
‘중심극한정리’란 무엇인가?
중심극한정리와 이항분포
‘숫자 3개’로 그래프를 이해한다
이항분포의 ‘평균’과 ‘분산’
정규분포의 특징은 이항분포에도 적용된다

5장 시청률?출구조사의 원리
―세상의 수수께끼를 통계학으로 해명한다

총세대수 5800만
8400분의 1의 샘플로 어떻게 시청률을 알 수 있는가
시청률은 정말로 정확할까?
역시 무작위는 어렵다
시청률에는 ±2%의 오차가 있다
시청률의 ‘평균값’과 ‘분산’
왜 샘플이 90세대분이면 안 되는가
선거 출구조사로 어떻게 당선 확정을 알 수 있는가
출구조사란 무엇인가
후보가 3명인 선거구의 경우
출구조사 결과에서 알 수 있는 내용
‘무작위’가 전제조건이다
통계학을 배우기만 하고 끝이면 안 된다

후기

책 소개

젊은 세대가 앞으로 ‘무엇을 배워야 하느냐’고 묻는다면 저자는 다음 3가지를 꼽았다. 바로 어학과 회계학, 수학이다. 특히 요즘은 수학 중에서도 ‘통계학’이 주목받는 추세다. 인터넷 활용이 당연시된 이 시대에 방대한 자료를 수집하기란 식은 죽 먹기이지만, 그 자료를 처리하고 정리 그리고 이해하려면 통계학이 필요하다는 사실을 깨달았기 때문이다. 통계학은 어렵다. 하지만 통계학은 우리 생활 곳곳에 존재한다. 시청률이나 출구조사의 원리를 이해하는 것은 통계학 중 난이도가 높은 부분을 건드리지 않아도 가능하다. 통계학의 기초 단계조차 제대로 이해하는 사람이 그리 많지 않다. 아니 통계학을 어느 정도 안다고 생각하지만 사실은 그것을 써먹지 못하는 사람이 너무 많다. 저자는 이 책을 선택한 독자들이 ‘안다고’ 착각하는 상태에 머무르지 않기를 바란다고 했다. 그래서 이렇게 생각했다. 통계학의 기초라고도 할 수 없는 초보 중의 초보, 그 맛을 살짝 핥아보는 수준만 되새김질하며 하나하나 친절하게 설명하기로 했다. 중학교 수학을 제대로 이해하고 있다면 간신히 알 수 있는 범위만 다루기로 한 것이다.
그러므로 이 책을 읽으면 누구나 통계학을 활용할 수 있다는 말은 절대로 할 수 없다. 이 책은 통계학 입문서를 읽었지만, 그 내용을 이해하지 못한 사람을 대상으로 썼다. 통계의 초보 중의 초보라는 아무도 해보지 않은 일에 도전했다. 이 책의 내용을 이해한 다음에는 어떤 통계 입문서도 끝까지 읽을 수 있을 것이다. 초보 중의 초보 수준이지만 진지하게 그 방법을 익히면 당신은 통계학이라는 무기를 장착하게 될 것이다. 그렇게 되리라 믿고 이 책을 끝까지 읽어나가길 바란다.

저자 및 역자 소개

동경대학교 이학부 수학과·경제학부 경제학과를 졸업한 후, 박사학위(정책연구)를 취득하고 1980년에 대장성에 입성했다. 대장성 이재국 자금기획실장과 프린스턴대학교 객원연구원, 내각부 참사관, 내각 참사관 등을 역임했다.
고이즈미 내각과 제1차 아베 내각의 브레인으로 활약하고 2008년에 퇴임했다. 현재는 가에쓰대학교 비즈니스창조학부 교수와 주식회사 정책공방 대표이사 회장을 맡고 있다.
저서로 《한심한 외교론》 《한심한 경제론》 《도해 피케티 입문》 《전쟁의 역사를 통해 배우는 지정학》 《99%의 일본인이 모르는 국채의 진실》 《화이부실 시진핑의 중국몽》 《잘 있어라, 재무성! : 관료 모두를 적으로 돌린 사내의 고백》 등 다수의 베스트셀러가 있다.
목록으로 돌아가기

상호 : (주)엔다스 / 대표 : 이선규 / 주소 : 서울시 금천구 가산로 9길 66 (가산동 더리즌밸리 지식산업센터) 206호 / 사업자번호 : 105-87-51751
전화 : 070-7860-1040~6 / 팩스 : 02-6442-5603 / E-mail : dailybook@dailybook.kr
Copyright EnDas inc. All Rights Reserved.