ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [TIL] 새빨간 거짓말, 통계 - 작은 숫자를 생략하여 사기 치는 법
    TIL 2024. 4. 22. 21:44
    728x90

     

    오늘 TIL 3줄 요약

    • 시행 횟수가 충분히 커야만 여러 현상을 제대로 설명하거나 쓸모 있는 예측을 할 수 있게 된다.
    • 유의수준이란 어떤 사실이 참임에도 불구하고 거짓으로 잘못 판단할 확률을 말한다.
    • 게젤의 준거'에 관한 문제가 있다. 이것은 준거에 해당하는 표준차와 자기아이와의 근소한 수치 차이가 부모들의 고통을 유발하는 현상이다.

    TIL (Today I Learned) 날짜

    2023.04.21

     

    오늘 읽은 범위

    3장. 작은 숫자를 생략하여 사기 치는 법

     

    책에서 기억하고 싶은 내용

    • '도크스(Doakes) 회사의 치약으로 23% 충치 감소' 라는 문구가 사실이라며, 충치가 23%나 줄어든다니 정말 괜찮은 치약이라고 누구나 생각할 것 같다. 하지만 이 결과는 단 열두 명을 대상으로 실험한 결과에 지나지 않는다. 
    • 가장 커다란 속임수는 불충분한, 즉 통계적으로 불충분한 표본을 채택했다는 점이다. 적은 인원으로 실험을 하는 중요한 이유는 실험집단이 대규모이면 우연에 의해 나타나는 차이가 아무래도 미미해지고 따라서 위와 같은 커다란 제목의 광고를 내걸 수 없고 단지 2% 정도 충치가 줄어들었다는 광고를 통해서는 치약의 판매실적을 높일 수가 없기 때문이다.
    • 동전 던지기에서 확률은 50대 50의 결과와는 동떨어진 매우 엉뚱한 결과를 얻었을 확률이 많다. 그러나 천 번쯤 던져 보면 앞면과 뒷면이 나올 확률이 거의 반반이 되어 실제 확률에 가까이 갈 것이다. 이와 같이 시행 횟수가 충분히 커야만 여러 현상을 제대로 설명하거나 쓸모 있는 예측을 할 수 있게 된다.
    • 확실치도 않은 결론에 속지 않으려면 누구나 쉽게 이해할 수 있는 유의판정법(어떤 통계숫자가 우연에 의해 나온 거시 아니라 실제로 그 무엇 때문에 발생하였을 확률이 어느정도인지를 보여 주는 간단한 방법)이 있다.
    • 유의수준이란 어떤 사실이 참임에도 불구하고 거짓으로 잘못 판단할 확률을 말한다.
    • 사소한 숫자이지만 생략함으로써 문제가 발생하는 예로 '게젤의 준거'에 관한 문제가 있다. 이것은 준거에 해당하는 표준차와 자기아이와의 근소한 수치 차이가 부모들의 고통을 유발하는 현상이다. 갓난아이는 생후 몇 개월에 혼자 똑바로 앉아 있을 수 있게 된다는 기사를 예시로 들 수 있다.
    • 그래프에서 중요한 숫자가 빠져 있을 때는 평균이든지 또는 그래프이든지 아니면 어떤 경향이든지 간에 이를 믿어서는 안 된다. 이에 대한 믿음을 갖는 것은 마치 평균온도만 조사하고 나서 캠핑 장소를 결정하려는 사람처럼 눈 뜬 장님과도 같다.

     

    떠오르는 생각

     

    오늘 읽은 부분에서는 '게젤의 원리' 내용이 인상깊었다. 게젤 박사나 그의 실험 방법의 탓으로 돌릴 수는 없으며 이런 잘못된 현상이 발생하는 이유는 연구자가 자신의 연구 결과를 발표했을 때, 선동적이고 아는 것도 별로 없는 기자가 기사를 작성하면서 독자들이 알아야 할 정말로 중요한 숫자 몇 개를 빼놓고 전달하기 때문이라고 한다. 사실은 사람마다 무엇을 배우고 알아가는 시간이 다를 수 있는데 말이다. 지인의 아이가 나이 또래들보다 말이 느리다고 주위 사람들이 걱정하던 모습이 떠올랐다. 남들보다 느리다고 해서 잘못된 것이고 올바르지 않은 것인가? 라는 생각도 들면서 한편으로는 자극적인 헤드라인과 내용으로 독자들의 시선을 끌려는 매체들 때문에 관련 내용에 대해서 맹신하고 오해하는 사람들이 생기는 내용들에 대해서도 여러 생각들이 들었다.

     

    728x90
Designed by Tistory.