t-test의 정의
- t-test는 두 집단 간의 평균 차이를 비교할 때 매우 유용한 도구로, 과학, 사회과학, 심리학 등 다양한 분야에서 널리 사용됩니다.
- t-test는 두 집단의 평균을 비교하여 그 차이가 통계적으로 유의미한지 확인하는 통계적 검정 방법입니다.
- t-test는 세 가지 주요 형태로 나눌 수 있습니다: 독립표본 t-검정, 대응표본 t-검정, 단일표본 t-검정입니다.
1. 독립표본 t-검정 (Independent Samples t-test)
- 정의: 두 개의 독립적인 집단의 평균이 동일한지 여부를 검정하는 방법입니다.
- 예시: 남학생과 여학생의 수학 성적 평균을 비교할 때 사용합니다.
- 가정: 두 집단의 데이터가 정규분포를 따르고, 분산이 동일하며, 데이터가 독립적이어야 합니다.
- 공식:
여기서 X과 X는 두 집단의 평균, s1과 s는 표준편차, n1과 n2는 샘플 크기입니다.
2. 대응표본 t-검정 (Paired Samples t-test)
- 정의: 동일한 집단에서 두 시점의 평균이 동일한지 여부를 검정하는 방법입니다.
- 예시: 같은 학생들의 이전 시험 성적과 현재 시험 성적을 비교할 때 사용합니다.
- 가정: 데이터 쌍이 정규분포를 따르고, 차이값이 정규분포를 따릅니다.
- 공식:
여기서 d는 두 시점의 차이의 평균, Sd는 차이의 표준편차, n은 샘플 크기입니다.
3. 단일표본 t-검정 (One Sample t-test)
- 정의: 한 집단의 평균이 특정 값과 같은지 여부를 검정하는 방법입니다.
- 예시: 한 학급의 평균 성적이 특정 기준 점수와 같은지 확인할 때 사용합니다.
- 가정: 데이터가 정규분포를 따릅니다.
- 공식:
여기서 X는 샘플 평균, μ는 비교할 기준 값, s는 표준편차, n은 샘플 크기입니다.
4. t-test의 일반적인 과정
- 가설 설정:
- 귀무가설 (H0H_0): 두 집단의 평균이 같다고 가정합니다.
- 대립가설 (H1H_1): 두 집단의 평균이 다르다고 가정합니다.
- 유의수준 설정:
- 일반적으로 0.05를 사용합니다. 이는 5%의 확률로 귀무가설이 참임에도 불구하고 이를 기각할 가능성이 있음을 의미합니다.
- 데이터 수집 및 계산:
- 두 집단의 평균, 표준편차, 샘플 크기를 계산합니다.
- t-값을 계산합니다.
- p-값 계산:
- t-값을 바탕으로 p-값을 계산합니다.
- 결과 해석:
- p-값이 유의수준보다 작으면 귀무가설을 기각하고, 대립가설을 채택합니다.
- p-값이 유의수준보다 크면 귀무가설을 기각하지 않습니다.
'코드잇 데이터 애널리스트 위클리 페이퍼' 카테고리의 다른 글
클래스와 인스턴스란? (0) | 2024.07.10 |
---|---|
데이터 전처리는 어떻게 하나? (0) | 2024.07.04 |
p값 (p-value)는 무엇인가? (0) | 2024.06.24 |
제1종 오류와 제2종 오류란? (0) | 2024.06.24 |
기술통계와 추론통계란? 어떤 차이가 있나 (0) | 2024.06.19 |