본문 바로가기

공부하는 날

[People Analytics] 급해서 찾아보는 t-test(t검정)

 

이터 분석력 0인데 숙제는 해야하는 상태

 

조직 특성(구성)에 따라 리더십 진단 결과에 차이가 있는지 분석하기로 하였는데, 

리더십 진단 결과가 점수가 아니라 강점과 보완점이다.

 

하여, 특정 리더십 역량이 강점 또는 보완점으로 나온 집단과 그렇지 않은 집단을 비교해보기로 하고

두 집단을 비교하는 t-test를 공부해보기로함 

 

뭐하고 있는지도 모르겠으나, 

하다보면...길이 나오려나...ㅠ

 

 

 

 

우선 유튜브에서 듣기 편한 영상을 찾았고, 2편까지 보고, 정리하면서 보면 좋을 것 같아서 블로그를 열었다

 

학습하기에 좋은 영상은 

- 속도가 적절하고 (영상 속도 조절만으로는 어려운, 말의 템포 &스타일이 있다)

- 내용에 차근차근 접근하며 (나는 진짜 똥멍청이급 초보니까)

- 예시를 잘 들어주는 특징이있는 것 같다

 

아무튼, ※학습노트

3-3. 너무 빨리 먹으면 체합니다 -t-test(3) = z-test

* z-text & t-test는 본질적으로 같음. z-text는 모집단, t-test는 표본집단을 대상으로 함

 

* 정규 분포

   - 정규 분포의 아래 면적은 확률을 의미

   - 표준 정규 분포는 평균이 0이고 표준 편차가 1인 정규 분포 

   - 정규 분포를 표준 정규 분포로 바꾼 후,

     z-score = (값-평균)/표준편차

   - 표준정규분포표의 확률표 참고

 

* t-test의 질문 (3-2 복습)

  - A대학 남학생 평균 키 vs. B대학 남학생 평균키가 우연히 같은 확률은? 

    . 두 집단의 차이가 표준편차보다 현저히 작으면 ㅡ 그 차이에 큰 의미를 둘 수 없음

    . 두 집단의 차이가 표준편차보다 현저히 크면 ㅡ 그 차이에 큰 의미를 둘 수 있음

  - 우연히 발생했을 확률 = 정규 분포 면적을 활용한 확률

  - 다만, t-test는 정규분포가 아닌 다른 분포 곡선을 사용 

 

3-4 단순하지만 헷갈릴 수도... - t-test (4)

* 양측 검정 vs. 단측 검정

   - 양측 검정과 단측 검정의 차이는 대립 가설의 차이에서 발생

   - 양측은 0보다 크거나 작은 두 가지를 모두 포함하므로 분포 곡선의 양쪽 꼬리의 면접의 합이 5%에 들어갈만큼 크거나 작아야함

   - 단측은 0보다 크다(우측검정)와 0보다 작다(좌측검정)의 두 가지로 나누어볼 수 있고 한쪽 꼬리의 면적이 5%에 들어갈만큼 크거나 작아야 한다

   - 0을 기준으로 양측이든 단측이든 95%안에 들어오면 두 평균값의 차이는 우연히 발생한 것

 

3-5 이제야 t-test를 하다니 - t-test (5)

* t-value = 두 집단의 평균 차이 / (표본의 표준 편차 / 표본의 갯수)

  - 표본의 갯수가 많아지리 수록 t-value는 높아지고 정규 분포에 가까워짐 

* df(degree of freedom) = 표본 개수 - 1

* t-table에서 df와 confidence level의 critical value를 찾아 t-value와 비교 

 

3-6 종류별로 알아보자 - t-test (6)

* t-test의 종류 : two-sample t-test, one-sample t-test, paired t-test    

* 계산은 컴퓨터에 맡기자!!! >> 아주 마음에 드는 부분ㅋ

 

3-7 t-test를 컴퓨터에서 실습해보자 - t-test (7)

*Jamovi www.jamovi.org

 - 영문으로 작성된 데이터만 사용 가능

 

내일 데이터 분석해보면 뭐라도 나오겠지.

희망을 가지고 여기까지.

반응형