좋은 정보 공유

초등학생도 이해하는 통계 지식들

세이브티 2025. 3. 21. 16:56
반응형

1. 무작위 대조 실험(Randomized Controlled Trial, RCT)

  • 무작위 대조 실험이란?
    → 한 실험에서 두 그룹(예: A팀과 B팀)을 만들고, 누가 어느 팀에 들어갈지 제비뽑기처럼 랜덤으로 정하는 것이에요.
    → 예를 들어, 어떤 감기약이 효과가 있는지 알고 싶다면, A팀은 감기약을 먹고, B팀은 가짜약(플라세보)을 먹게 합니다. 그리고 결과를 비교하죠!
  • 왜 랜덤으로 해야 할까?
    → 만약 건강한 사람만 A팀에 넣고, 약한 사람만 B팀에 넣으면, 감기약의 효과를 정확히 알기 어려워요.
    → 그래서 랜덤으로 나누어서 공평하게 비교하는 거예요!

2. 통계적 유의성(Statistical Significance)

  • 통계적 유의성이란?
    → 어떤 차이가 우연이 아니라 진짜 의미 있는 차이인지 확인하는 거예요.
  • 예를 들어 볼까?
    → 농구에서 공을 10번 던져서 8번 골을 넣은 선수공을 10번 던져서 5번 성공한 선수가 있다고 해봐요.
    → 차이가 있어 보이지만, 10번밖에 던지지 않았기 때문에 그냥 운이 좋았을 수도 있어요.
    → 하지만 100번 던져서 80번 성공 vs. 100번 중 50번 성공이라면, 이건 진짜 차이일 가능성이 커요!
  • P-value(유의확률)
    → 과학자들은 **p-value(유의확률)**이라는 숫자를 사용해요.
    → 보통 **p-value < 0.05 (5%)**이면, "이 차이는 우연이 아니고, 진짜 의미 있는 차이다!"라고 말해요.

3. 신뢰구간(Confidence Interval, CI)

  • 신뢰구간이란?
    → 결과가 대략 어느 범위 안에 있을지 알려주는 숫자예요.
  • 예를 들어 볼까?
    → "너 시험 몇 점 맞았어?"라고 물었을 때
    → "아마 80~90점 사이일 거야"라고 대답하는 것과 비슷해요.
    → 이때 80~90점신뢰구간이에요.
  • 왜 중요할까?
    → 예를 들어, N95 마스크와 수술용 마스크의 감염 예방률 차이가 -2%에서 +1% 사이라면, 이 차이는 0일 수도 있고, 정말 의미가 없는 차이라는 뜻이에요.

4. 위험비(Risk Ratio, RR)와 오즈비(Odds Ratio, OR)

  • 위험비(RR, Risk Ratio)란?
    → 위험비는 어떤 일이 한 그룹에서 더 자주 일어나는지 비교하는 숫자예요.
    → 예를 들어, 감기에 걸릴 확률이 A팀(마스크 착용)에서는 10%, **B팀(마스크 미착용)에서는 20%**라면?
    → B팀이 A팀보다 2배 더 감기에 걸릴 가능성이 크다고 말할 수 있어요. (RR = 2)
  • 오즈비(OR, Odds Ratio)란?
    → 오즈비는 어떤 일이 일어날 가능성과 일어나지 않을 가능성을 비교하는 숫자예요.
    → 예를 들어, 마스크를 쓴 사람이 감기에 걸릴 확률이 1:9 (1명 걸리고 9명 안 걸림), 안 쓴 사람이 2:8 (2명 걸리고 8명 안 걸림)이라면?
    → OR = (1/9) ÷ (2/8) = 0.44
    → OR < 1이면 마스크를 쓴 게 효과가 있다는 뜻이에요!

5. 표본 크기(Sample Size)와 검정력(Power)

  • 표본 크기(Sample Size)란?
    → 실험에 참여한 사람 수예요.
    → 표본 크기가 클수록 결과가 더 정확해요!
  • 왜 중요할까?
    → 친구 2명에게 "초코 아이스크림 좋아해?"라고 물어봤더니, 둘 다 싫어한다고 하면
    → "세상 사람들은 초코 아이스크림을 싫어한다!"라고 말할 수 있을까요? ❌
    → 더 많은 사람에게 물어봐야 진짜로 맞는지 확인할 수 있어요.
  • 검정력(Power)이란?
    → 차이가 정말 있는 경우, 그것을 발견할 수 있는 확률이에요.
    → 표본 크기가 크면 작은 차이도 발견할 확률이 높아져요!

6. 다변량 분석(Multivariate Analysis)

  • 다변량 분석이란?
    → 여러 가지 요인(변수)이 동시에 영향을 주는지 확인하는 방법이에요.
  • 예를 들어 볼까?
    → "어떤 학생이 시험을 잘 보는 이유가 뭐야?"
    • 공부 시간?
    • 수면 시간?
    • 학원 다니는지 여부?
    → 이 모든 요소를 한꺼번에 분석하는 것이 다변량 분석이에요.
    → 마스크 연구에서도 마스크 종류뿐만 아니라 나이, 성별, 근무환경이 감염에 영향을 줬을 수 있어요.

7. 절대 위험 감소(ARR) vs. 상대 위험 감소(RRR)

  • 절대 위험 감소(ARR, Absolute Risk Reduction)
    → 감염 위험이 몇 % 줄어드는지를 직접 계산한 값이에요.
    → 예를 들어,
    • N95 마스크: 감염률 8%
    • 수술용 마스크: 감염률 10%
    • ARR = 10% - 8% = 2% (감소)
  • 상대 위험 감소(RRR, Relative Risk Reduction)
    → 줄어든 비율을 원래 확률과 비교하는 값이에요.
    → 예를 들어,
    • RRR = (10% - 8%) ÷ 10% = 20% 감소
  • 차이점은?
    → ARR은 "얼마나 줄었는지",
    → RRR은 **"줄어든 퍼센트가 원래 위험 대비 몇 배인지"**를 나타내요.
반응형