KING JESUS

엑셀 t-검정 본문

능력의 삶/해피하우스

엑셀 t-검정

KING JESUS 2009. 1. 29. 23:57

5장 T- 검정

1. 들어가는 이야기

(1) 연구문제

연구에서 문제는 변인간의 관계를 내포하고 있다.

(2) 연구가설

변인간에 기대되는 결과를 진술한 것(실행가설, 대체가설)

예) 남자보다 여자가 엑셀을 더 싶게 배울 것이다.

(3) 영가설(귀무가설)

변인간에 존재하는 유의성 있는 관계를 부정하는 것이다.

예) 남자와 여자는 엑셀을 배우는 데 차이가 없을 것이다.

(4) 연구가설이 만들어지면 귀무가설은 자동으로 만들어 진다.

여기서 부터 유치한 이야기

(5) 하늘을 우러러 한점 부끄럼 없기를..

우리의 조상들은 티없이 아름다운 세상을 꿈꾸어 왔습니다.

우리는 티없이 아름다운 세상을 물려주어야 할 책임이 있습니다.

Beau iful. 티없이(T 없다) 아름답다.

T 없다는 것은 무슨 소린가?

T 검정은 없다는 것이다.

다시 말하면 T 검정은 없는 것을 검정하는 것이다.

무엇이 없단 말인가?

두 집단의 차이가 없다는 것이다.

T 검정은 수학적으로 엄밀하게 t=0 인가를 검정하는 것이다.

T 검정은 영가설을 검정한다.

T 검정은 귀무가설을 검정한다.( 영가설=귀무가설)

T 검정은 연구가설을 검정하는 것이 아니다.

(6) 너무나 기각하고 싶은 귀무가설(각은 무가설)

누가 뭐래도 기각은 귀무가설!

누가 뭐라고 해도 정대상은 무가설!

(확인) 검정대상은 귀무가설인가요? 연구가설인가요?

(7) 채소뿌리의 끝부분과 윗부분은 잘라 버린다. 기각한다.

어쨌던 기각은 양쪽 끝 영역이다.

(8) 오류의 종류와 유의수준

① 제1종 오류 : 귀무가설이 사실일 때, 귀무가설을 기각한다는 결론을 내리는 경우

② 제2종 오류 : 귀무가설이 사실일 때, 귀무가설을 기각하지 않는다는 결론을 내리는 경우

이때 제 1 종 오류를 범할 확률의 최대허용치를 유의수준(significance level) 이라 하며, 알파로 나타낸다. 알파의 값은 주로 0.01, 0.05, 0.10 과 같은 작은 값으로 사용한다. 그 중에서 특히 0.05 가 가장 널리 이용되고 있다.

(9) 양측 검정, 단측 검정

2. t 검정- 등분산 가정 두 집단

(1) 가정

① 확률표본이 정규분포를 따른다.

② 서로 독립-서로 영향을 미치지 않는다.

③ 동일한 분산을 갖는다.

(2) 엑셀에서 검정 실행순서

① 엑셀의 [도구]의 맨 아래에 데이터 분석이 없는 경우 추가 기능을 누른다.

두 반의 성적을 입력하였다.


② 아래 그림의 맨 윗부분 분석도구를 선택한다.


③ [도구] [데이터 분석]에서 t-검정: 등분산 가정 두집단을 선택하자.

④변수 1 입력범위(1)의 오른쪽에 있는 을 누른다.

⑤ 자료가 있는 부분을 드래그 한다.

첫행의 1반 에서 부터 자료의 끝까지 드랙그한다.

⑥ 변수 2 입력범위(2) 에 대해 반복한다.

⑦ 가설평균차는 입력하지 않으면 0으로 처리한다.

⑧ 이름표를 선택한다. A1셀과, A2셀의 1반, 2반 이 통계 처리결과에 나타난다.

이름표를 선택하고 A1셀과, A2셀의 1반, 2반을 선택하지 않으면 다음과 같은 에러가 나타난다.

⑨ 유의수준은 0.05로 되어있다. 사용자가 선택하는 것이다.

⑩ 출력범위는 나타내고자 하는 셀을 선택하면 된다.

2) 결과 해석


① 결과해석

ⅰ) t 통계량으로 해석

단측 검정인 경우 11행의 t 통계량이 13 행보다 크면 기각

양측 검정인 경우 11행의 t 통계량이 양측 검정인 경우 15 행보다 크면 기각

ⅱ) p 값으로 해석

단측검정인 경우 12행의 p 값이 0.05 보다 작으면 기각

양측검정인 경우 14행의 p 값이 0.05 보다 작으면 기각

x 축이 t 값이다. ----> t 값 커지는 방향

끝으로 부터 오는 면적이 p 값이다. <------- p 값이 커지는 방향

② 5 행에서 두 반의 평균을 알 수 있다. 45.4-37.7=7.7 의 차이가 나는데 이 점수가 우연에 의해 나타난 값인지, 아니면 2반의 성적이 좋다고 할 수 있는지 검정하는 것이다.

두 반의 차이가 없다를 검정하는 것이 귀무가설이다.

③ 분산에 대해 알아보자.

극단적으로 1반의 성적은 100, 0, 100, 0 으로 평균이 50 이다. 2반은 51,49,51,49 역시 평균은 50 이다. 평균에서 멀어진 값이 많을 수록 분산을 커진다. 두 집단의 평균이 같다고 해서 동질 집단이라 할 수 있는가?

2행을 보면 t-검정 등분산 가정 두 집단이라고 한 것은 두 집단의 분산이 동질이라는 가정을 한다는 것이다.

만약 등분산이 아니라면 어떻게 할 것인가?

그럴 땐 't-검정 이분산 가정 두 집단' 을 실행한다.

그러면 등분산 가정인지, 이분산 가정인지를 어떻게 판단할 것인가?

④ 공동분산은 t 통계량을 구하는 데 필요하다.

⑤ 등분산 가정에서 자유도가 나타나 있다.

⑥ 11행의 t 통계량이 15 행의 t 기각치 양측검정 값보다 크면 기각이다.

기각의 대상은 귀무가설이다.

3. SPSS 검정

① 엑셀의 자료를 SPSS 에서 분석하기 쉽도록 고친다.

② 1반과 2반의 자료를 복사해서 SPSS 에 붙인다.

③ 독립표본 T-검정을 실시한다.

④ Define Groups(집단 정의)를 누른다.

Cut point(분리점)- 변수의 값이 연속인 경우 두 변수를 나눈 점이다. 예를 들면, 평균을 중심으로 두 집단으로 분리할 때 평균을 입력함으로써 이용할 수 있다.

⑥ Option 대화상자에서

⊙ 신뢰구간 - 평균의 차이에 대해 95% 신뢰수준이 기본설정되어 있다.

⊙ Missing Values(결측값)

분석별 결측값 제외- 집단화된 변수 또는 검정할 변수들이 무응답치를 가진 케이스들은 해당 변수의 분석에서 제외한다.

목록별 결측값 제외- 집단화된 변수 또는 검정할 변수들이 무응답치를 가진 경우, 그 케이스들은 모든 분석에서 제외한다.

⑦ 분석결과는 평균, 표준편차, 표준오차가 나타나있다.

⑧ 독립표본 검정에 대한 결과이다

T 검정에서는 두 집단의 분산의 동질성일 먼저 알아야 한다. 분산의 동질성 여부는 Levene 의 등분산 검정, 즉 F 값을 이용한다. F 검정의 귀무가설은 두 분산의 차이가 없다는 것이다. 위에서는 유의도가 0.593 이므로 P>0.05 에 해당하므로 집단의 분산이 같다는 가설은 기각하지 못한다. 따라서 등분산이 가정(Equal)을 알수 있다. 등분산가정 t 검정의 귀무가설은 두 집단의 차이가 없다는 것이다. t 검정의 유의도는 0.025 이다. 따라서 5% 유의수준에서 두 집단의 평균이 같다고 볼 수 없다. 즉 두 집단의 차이가 있다고 결론 내릴 수 있다.

변수

평 균

표준편차

T 값

유의수준

종속변수

독립변수

평균의 차

1반

2반

45.4

37.7

7.9331

6.0378

2.442

0.25

 

5. 이분산 가정

모집단이 정규분포를 따르며 독립적인 확률표본이라는 가정이 필요하지만, 두 집단의 분산이 동일하다는 가정을 필요하지 않다.