※ 학습 노트


이런 강의가 있다.


---


Data science from MIT 

 

Computer Science의 탑 1위 대학인 MIT 공대의 "Introduction to Computational Thinking and Data Science" 수업 영상 및 강의 자료를 한국어로 번역하여 여러분께 제공합니다.

해당 강좌에서는 데이터 과학이라는 분야를 시작하기 위한 알고리즘과 통계학 그리고 기계학습의 내용을 조금씩 나눠서 다루고 있으며, 프로그래밍 실습보다는 문제 해결방법 대해서 집중적으로 공부합니다. 본격적인 데이터 과학 분야에 진입하기에 앞서, 해당 분야를 배우기 위해서는 어떤 것을 더 학습해야 하는지 체험할 수 있는 강의입니다.


---


Edwith에서 수강할 예정이지만, MIT 강의라고 하니 글로벌 플랫폼에 업로드 되어있을 것 같아 찾아보았다.

>>edX와 Youtube에 있는 듯.

(Coursera에서 the most popular 과정 중 하나인 'Python for everybody(모두를 위한 파이썬)' 도 Edwith에 한글화된 버전으로 볼 수 있다.)





* 해당 분야를 배우기 위해서 어떤 것을 더 학습해야 하는지 체험할 수 있는 강의


학습해야할 새로운 영역들은 계속해서 생겨나는데, 

범위가 처음부터 정해져있지도 않거니와 계속해서 확장하고, 변화한다.

고등학교 때처럼 정해진 교과, 정해진 범위 내에서 체계적으로 공부하기가 어렵다.

(그때가 좋은 거였...다고 말하면 안되겠지..! ㅋ 그때는 그때만의 고통과 괴로움이 있었으니까-)


올해는 수행해야할 과제가 있어서 이것 저것 닥치는 대로 찾아보았다.

지금도 아주 초초초초보지만, 그래도 아주 처음보다는 들은 것, 본 것들이 생겼다.

학습 분야의 용어에 익숙해지는 것도 중요한 것 같다.


계속해서 업데이트하고 수정해야겠지만, 학습자만의 체계와 체크리스트를 만들어가는 것도 학습의 방법 중에 하나일 것 같아서,

조금씩 정리해보기로 했는데....



* 선수조건


1. 모두를 위한 프로그래밍: 파이썬

2. 모두를 위한 프로그래밍: 파이썬 자료구조

3. 모두를 위한 프로그래밍: 파이썬을 이용한 데이터베이스 처리

4. CS50 x edwith

5. Introduction to Computer Science and Programming in Python



그런데, 당황스럽게도 선수조건이 왜이렇게 많지...! ㅋㅋㅋ 해당 분야를 배우기 위해 어떤 것을 더 학습해야하는지 체험할 수 있는 강의라고 하여 아주아주 생초보자를 위한 것인줄 알았건만.!


다행히, 모두를 위한 프로그래밍을 학습한 후이긴하지만,

불행히, 이미 시간이 지나기도 했고, 학습을 기록해놓지를 않았기에, 

선수 조건인 과정부터 점검해보기로 하였다.


그런데 맙소사 ㅠ 내가 이미 들은 줄 알았던 과정도 '모두를 위한 프로그래밍: 파이썬' 만이다. 

갈길이 멀군



[모두를 위한 프로그래밍: 파이썬 자료구조] 부터 시작한다.

(Chapter 6~8)


*** 알아야할 것 : 타입 변환, 인덱싱, len 함수, for 루프


* len 함수 : 문자의 길이 >>>리스트가 몇 개의 항목을 가지고 있는지 확인 가능

* print(s[0:4]) - 4번째 인덱스는 읽지 않음!

  print(s[:2]) - 첫 번째나 마지막 인덱스 생략할 경우, 시작 또는 마지막까지 가정하고 반환

* strings는 object이고 object는 method라는 것을 가지고 있음

* replace (문자바꾸기)

* lstrip (왼쪽 공백 없애기), rstrip (오른쪽 공백 없애기), strip (양쪽 공백 없애기)

* startwith (시작 문자열 찾기)

* 파이썬3에서부터는 모든 내부 문자열이 유니코드 (한국어가 예시로 나온다!)

  유니코드 연산이어도 문자열로 인식. (파이썬3에서는 문자열이지만 유니코드 상수가 별개로 있었고 다른 자료형으로 인식함)

* open() 파일을 여는 것

\n >>> 다음 줄로

* read()

통상 프로그래밍은 알고리즘과 자료구조로 나눌 수 있음

   - 알고리즘: 특정 문제를 해결 하기 위한 규칙 또는 단계

   - 자료구조: 컴퓨터 내에서 자료를 구조화 하는 특별한 방식


* list(리스트)

  1. 리스트의 각 항목들은 '[]'로 둘러싸임
  2. 리스트 내의 항목들에 대한 구분은 ,(콤마)로 구분
  3. 리스트 내에 또 다른 리스트를 내포할 수 있음
  4. 비어 있는 리스트를 만들 수 있음
  5. 리스트의 항목들에 인덱스 값으로 접근 가능.
  6. 리스트의 항목들은 바뀔 수 있음


* range() >>> 인자로 전달되는 값에 따라서 숫자로 이루어진 리스트를 반환


* .list() >>> 리스트 만들기

* .append('book') >>리스트에 추가

* .sort() >>> 정렬

* .split() >>> 공백을 찾아 조각을 반환

  .split(';') >>> 세미콜론 기준으로 Split해주지 않으므로 별도 정의


* 컬렉션(collection)리스트나 딕셔너리 같은 변수를 가지는 상황. 하나의 정보보다는 여러 개의 정보를 저장할 때 사용

* 리스트(list): 순서대로 정렬한 컬렉션. 데이터를 추가하면 항상 리스트의 끝에 추가되고 0부터 n-1번 위치까지 순서대로 n개의 원소가 저장됨

딕셔너리(dictionary)

- 순서 없음. 대신 키(Key) 존재

-ooo={} 또는 dict()라는 생성자를 통해 생성

- {중괄호} 안에 Key:Value 형태로 저장


* get 함수 : 

counts.get(name,0)


>>>딕셔너리에 name이라는 키가 존재할 경우 값을 불러오고,

그렇지 않을 경우에는 딕셔너리의 name이라는 키에 0이라는 값을 갖는 데이터를 추가하라는 의미

if name in counts:

   x = counts[name]

else :

   x = 0 

 x = counts.get(name,0) 


* items 메소드

keys, values 메소드로는 딕셔너리의 키와 값의 쌍을 얻음 >>> items 메소드를 사용하면 됨

items 메소드를 실행하면 '튜플(tuple)'이라는 자료 구조 안에 키와 값이 쌍을 이루어 저장된 리스트가 반환됨


* Tuples(튜플) 리스트와 거의 비슷하지만 변경불가능(immutable), 즉 값 변경 (정렬, 값 추가, 순서 변경) 불가하다는 특성에서 차이가 있음

그러나 리스트보다 훨씬 효율적으로 작동함 (용량 적게 차지, 근 빠름)

* 내장된 함수 차이

l = list()

 dir(l)

# ['append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']

  t = tuple()

 dir(t)

# ['count', 'index']


* sorted 함수 :  딕셔너리는 키 기준으로 정렬된 값이 나옴

반응형

학창 시절부터 사회 생활 초년생때까지의 아침은,  알람 소리에 겨우 일어나서 잠이 덜 깬 상태에서  준비하는 것으로 시작하였다.

사람은 생체 시계라는 것이 있어서 몇 시에 일어나야지, 마음 먹으면 그 시간에 눈이 떠지기도 한다는데-그렇게 알람을 맞춘 시간 언저리에 눈이 떠질때가 많았다.

30분 전에 깨면 조금이라도 더 잘 수 있는데, 10분 전이면 금방 일어나야해서 불안감에 다시 잘 수가 없고 그게 그렇게 억울했다 ㅎㅎ

 

지금 너무 좋은 점은, 알람없이 눈이 떠질 때 일어난다는 것이다.

집과 회사의 거리가 바뀌었고, 출퇴근 시간도 자유로워졌다.

 

아침 시간을 보내는 것이 좋아서 출근 시간을 9시 30분으로 설정한다.

가볍게 운동하고 먹고 싶은 것을 챙겨 먹고 여유있게 준비하는 시간이 너무 좋다.

물론 운동은 아주...가끔하지만.

 

집 한켠에 홈트 도구를 구비해두고 싶지만 먼지가 쌓일까봐 망설이다가

월요일 아침에 가벼운 스트레칭을 성공한 후 자신감을 얻고 결국 주문을 하였는데,

아직 세팅이 되지 않아^^;;; 챙겨먹는 것만 열심히 하고 있다.

 

 

  챙겨먹기  

* (4일차) 피망을 채를 썰어 참치와 버무린 후 소금, 후추를 약간 뿌려 전자렌지에 3분 돌리면 밥 한 그릇 뚝딱이라고

  냉장고에 있는 명란이 있어서 소금은 생략하고 명란을 얹어 돌림!

  참치와 피망 둘 다 보관 기간이 길다. 장볼 때 하나씩 사두면 생각날 때 먹을 수 있을 것 같다.

 

 

* (5일차) 어디선가 먹은 과일 샐러드에 대한 기억이 있는데 이거다, 싶은 레시피를 발견하지 못하였다.

  네이버에 과일 샐러드를 검색하니 마요네즈에 버무린 사라다가 나올 뿐이고. 

  구글에 fruit salad dressing을 검색하니 요거트 드레싱만 나온다. 아닌데 아닌데.

 

  기억나는 건 과일과 견과류, 달콤한 드레싱 정도라 꿀을 먼저 장만하였다.

 

  최근에 엄마집에서 가져온 과일 + 내가 먹고 싶은 과일을 주문하였더니 과일 종류가 꽤 많아져서 

  과일 샐러드를 해먹어봐야겠다는 생각이 들었다.

  배, 샤인머스켓, 감, 로메인을 넣고, 

  파마산 치즈를 사려고 들어간 마켓컬리에서 산 트러플 호두까지 넣고 꿀을 뿌려먹었다. 

 

  맛은 있었으나- 뭔가 부족해 싶어서 fruit salad dressing + honey, oil 검색하니 honey lime dressing이 나온다.

  담번에 시도해봐야지 

 

 

* (6일차) 엄마가 문어와 깍두기를 주셨다.

  원래는 문어 샐러드를 해먹으려고 했는데... 갑자기 볶음밥을 해먹어도 맛있겠다는 생각이 들었다. 

  버터가 어울릴 것 같아 버터를 녹이고 문어, 깍두기, 샐러리를 볶다가 

  (다이어터니까) 현미곤약밥을 넣어 소금 없이 볶은 후에 멸치 다대기를 얹어서 먹었다.

  어디에 내놓을 레시피는 아니지만 개인적으로는 아주 맛있었다 >-<  

 

반응형

퇴근하고 학원에 갔다가 11시 넘게 집에 왔다.

잠이 오는데 자기 싫을 때가 있다. 어제가 그랬고, 인스타 피드를 보다가 우연히 보게된 옛날 영상을 타고 들어갔다가 

고딩래퍼 이영지의 영상들을 보게 되었고...2시 넘어 잠들었다 ㅠ

 

그래서 이틀차에 벌써 많이 짧아진 아침 일상이였다 ㅠ0ㅠ

 

 

  챙겨먹기   

* 위를 위한 양배추즙, 간을 위한 리버케어, 유산균

* 아보카도, 오이, 샐러리 + 레몬, 올리브오일, 오레가노, 소금 약간

* 바나나, 키위 감, 샤인머스켓

* 커피 다 떨어진김에 건강한 레몬 밤 티

 

 

  음악 감상   

* 오늘도 조성진

 

반응형

기록을 해보기로 합니다.

 

  아침 스트레칭   

* 아침 스트레킹으로 검색하여 스트레칭 하나 해줌

* 아침에 유산소, 저녁에 근력운동이 좋다고 하는데, 유산소 운동은 땀이날텐데 샤워를 아침저녁으로 해야하나;;;

 

 

 

 

  음악 감상   

* 좋아하는 음악을 찾아, 드뷔시 목신의 오후

 

 

* 좋아하는 음악가를 찾아, 조성진

 

 

 

  챙겨먹기   

* 위를 위한 양배추즙, 간을 위한 리버케어, 유산균

* 로메인, 오이, 닭가슴살 + 레몬, 올리브오일, 오레가노, 소금 약간

* 바나나 - 나트륨 배출에 좋다함. 특히 까맣게 익었을 때가 좋다고 함

* 커피는 포기하기 어렵다...

 

 

  청소   

청소를 해야겠다, 생각만 하긴 했으나, 지금 하고 올 예정.

- 음식 쓰레기 버리기

- 바닥 청소기 살짝

- 와플 기계 닦기

 

  그 외   

- 화분에 물주기, 허브 심은데에 물 뿌려주기

 

  기록하기   

오늘 아침에 부지런을 떨며 한 것들은 자기 전부터 마음 먹었던 것이 아니다.

아침에 눈이 떠진 김에 운동도하고 음악도 듣고 샐러드도 해먹었다.

 

나에게 좋은 것을 찾아가고 있는 중이니 부담갖지 말고 되는대로 하다가 어느 날 루틴이 되길 바라본다.

반응형

※복습 노트


* 파이썬 공식 스타일 가이드 


  - https://www.python.org/dev/peps/pep-0008/


  - https://docs.python.org/ko/3/tutorial/controlflow.html#intermezzo-coding-style



* List와 Dictionary


a_list = [ ] #비어있는 리스트 만들기

a_list.append() #리스트에 값을 넣는다


a_dict = { }



* 파이썬 명령어

def 함수이름 (필요한 변수들) :

   내릴 명령어들을 순차적으로 작성

#사용하기

함수이름(필요한 변수들  



* 파이썬 조건문

 def is_even(num): # is_even는 num을 변수로 받는 함수 이름 

      if num % 2 == 0: # num을 2로 나눈 나머지가 0이면 

           return True # True (참)을 반환한다. 

      else: # 아니면, 

           return False # False (거짓)을 반환한다.

 #html 조건문

 function is_even(num){

    if (num % 2 == 0) {

       return true; 

    } else {

       return false; 

    }

 } 



* 파이썬 반복문


 fruits = ['사과', '배', '참외'] 

 for fruit in fruits# fruit는 임의로 지은 이름 

      print (fruit)

 #html 반복문

 let fruits = ['사과','배','참외']

 for (let i=0; i<fruits.length; i++) {

      console.log(fruits[i])

 }



* 파이썬 조건문 & 반복문으로 숫자 세기


 fruits = ['사과', '배', '배', '감', '수박', '귤', '딸기', '사과', '배', '수박'] 

 def count_fruits(name): 

 count = 0 

 for fruit in fruits:

 if fruit == name: 

      count += 1 

 return count 


 subak_count = count_fruits('수박') 

 print(subak_count) # 수박의 갯수 출력

 #html 조건문 & 반복문으로 숫자 세기

 let fruits = ['사과', '배', '배', '감', '수박', '귤', '딸기', '사과', '배', '수박'] 

 

 let count =0;

 for (let i=0; i<fruits.length; i++) {

    let fruit == fruits[i];

    if (fruit =='수박'){

       count +=1;

    }

 }

 



* 웹스크래핑

  - 패키지 설치 : beautifulsoup4 HTML 코드를 쉽게 스크래핑 해오기 위한 도구

  - 태그 안의 텍스트를 찍고 싶을 땐 → 태그.text

    태그 안의 속성을 찍고 싶을 땐 → 태그['속성']



import requests
from bs4 import BeautifulSoup

headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://sports.news.naver.com/kbaseball/record/index.nhn?category=kbo', headers=headers)

# HTML BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
# soup이라는 변수에 "파싱 용이해진 html"이 담긴 상태가 됨
# 이제 코딩을 통해 필요한 부분을 추출하면 된다.


soup = BeautifulSoup(data.text, 'html.parser') 


*크롤링한 내용에서 공백 없애기 .text.strip()


반응형

건강을 위해 신경쓸 수 있는 것 중 - 지금 나에게 가장 비중이 큰 것은 먹을 것이지만 - 

수면과 반신욕도 도움이 될 것 같아 찾아봄

수면은 잘하고 있지만 ㅎㅎㅎ

 

  수면  

* from 스탠퍼드식 최고의 수면법, 이라고 인터넷에 떠돌아다니는 짤 중에 나에게 의미 있는 것 

   - 최소 6시간, 권장 7시간 확보

   - 매일 같은 시간에 자고 같은 시간에 일어나자

   - 자정 전, 가능하면 밤 11시에 자는 것이 좋다

   - 오전 5~7시 사이 개운하게 일어날 수 있다

   - 오전 9시까지 자는 것은 권하지 않는다 - 수면의 질이 떨어짐

   - 일어나는 순간 날씨와 상관없이 아침 햇빛을 쬐는 습관을 들인다 >>> 이거 정말 좋아하는건데!

   - 낮잠은 30분 이하로만 >>> 가능한가 ㅠ 안자고 말지 싶은데

   - 저녁을 거르면 수면에 악영향

   - 잠자기 2~3시간 전에 운동을 끝내기

 

  반신욕 방법   

* 명치 아래까지만 몸을 넣고 팔을 포함한 상체는 물 밖에! 

 * 일주일에 2~3번, 38~40도, 10~20분 정도가 적당

 * 미지근한 물로 샤워

 * from 스탠퍼드식 최고의 수면법 

 - 아침에 입욕하는 것은 추천하지 않는다

 - 취침 90분 전에 미지근  ~ 따듯한 물로 15분간 입욕을 하면 좋다

 

  반신욕-템 : 반신욕조  

* 반신욕조를 사고 싶었으나 - 

  욕조를 1년에 한 두 번 들어간다는 친구들의 말에 계속 망설이고 있었다 ㅋ

  몸을 편안히 담글 수 있도록 충분히 큰 것을 사고 싶은데, 

  제대로 안 쓰면 버리기도 번거롭고 짐이 될 것 같잖아

* 눈여겨보던 욕조가 오늘의 집에서 (내가 검색했던 네이버 스토어보다 조금 더) 싸게 팔길래 질러버렸다 ㅋ

  오늘의집 https://ohou.se/productions/382696/selling?affect_type=StoreSearchResult&affect_id=1

* 26일 재입고되어 27일부터 순차적으로 발송된다는 안내문이 있었기에 느긋하게 기다리고 있었는데, 3일만에 배송이 왔다.

  처음에는 빨리와서 좋았는데, 포장을 뜯고 설치를 해보니 뚜껑이 맞지 않자, 반품된 것을 준건가 싶었다.

  오늘의 집에 동일한 리뷰가 있길래, 안내된 대로 카카오톡에 업체를 등록하고 문의했다.

  당황스럽게도 원래 좀 그런 상품이니 양해하고 사용하면 안되냐는 답변을 받았다.

  그건 좀 어렵겠다 하였더니 가지고 있는 상품 사진을 보내며, 이 정도는 다 안 맞는다며, 이것을 보내도 되겠냐고 묻는다. 

  뭐지, 이 상황.

  재고 들어오면 맞는거 확인해서 다시 보내달라고 하였다.

(수정) 연락드려야지, 하는 시점에 새 뚜껑을 보내주셨고, 잘 맞음!

 

  반신욕-템 : 입욕제  

* 일단, 러쉬 것을 구입하였으나, 다른 브랜드/제품을 알아볼 예정 

  러쉬는 다양하고 재미있어서 좋지만 비싸고 향이 강하다

* 지금 산 것은 피치 크럼블 버블룬, 킨키 부츠,  버터베어

  - 킨키 부츠 반을 잘라 넣어봤는데 향이 매우 좋다!~

 

  

 

  

  

 

 

반응형

역시 사람은 물어봐야한다.

끝없이 헤매고 있다가 작년에 피플 애널리틱스를 시작한 동료에게 하소연하였더니 로지스틱 회귀분석을 찾아보라고 한다.

 

※학습노트

* 로지스틱회귀분석(logistic regression analysis)
  - 이항 로지스틱 회귀(binominal regression analysis) 종속변수의 범주 수가 2개 일 경우 
  - 다항 로지스틱 회귀(binominal regression analysis) 종속변수의 범주 수가 3개 이상일 경우
 
* 큰 값 (연구 관심 결과인 '있음')에 해당하는 경우로 분류될 확률
* Odds(비) Odds ratio (비의 비율) 로짓(Odds에 로그)

 

 

12-1. 로지스틱 회귀분석이란? - 로지스틱 회귀분석 (1)

* OLS 회귀 분석은 종속 변수가 nominal & continuous여야 함  

* 이항변수가 종속변수인 경우 OLS를 적용하였을 때 무엇이 문제인지 확인하는 예시를 다룸 

 > 기존 회귀계수를 해석하는데 문제가 있음 (x가 1증가할 때 y가 b만큼 증가한다고 할 수 없음), 0도 아닌 1도 아닌 예측값이 나옴

* 우리가 기대하는 것은 독립 변수가 1증가할 때 종속 변수가 1이 될 확률 >>> 엇, 내가 찾는 거 맞는 것 같다

 

12-2. 로짓과 로그오즈비란 - 로지스틱 회귀분석 (2)

* 종속변수가 이항변수인 경우 예) 성공/실패, 업/다운, 생존/죽음, Yes/No 등

로지스틱 회귀분석은, 

  - 이항 변수를 로짓이라는 개념을 통해 연속 변수처럼 바꾸어줌

  - 확률 개념 해석 가능

*오즈(Odds) = 확률 / (1-확)

*오즈비(Odd ratio)

*마이너스 무한대<로짓 = 로그(오즈비)<플러스 무한대

 

12-3.로지스틱 회귀분석을 해석해보자 - 로지스틱 회귀분석 (3)

* 일반 OSL & 로지스틱 분석 결과는 데이터의 유의미한 정도는 거의 비슷하게 나오나 해석이 다름

* estimate (회귀계수값)의 로그를 벗겨~

 엑셀에서 함수 exp(회귀계수) = 오즈비(odds ratio)

   - (오즈비-1) x 100은 %증가/감소로 해석 가능

*독립변수가 1단위 증가할때와 1단위 감소할때의 해석은 다름
 - {(1/(오즈비-1))=1} x 100으로 해석
 
*모든 독립변수 증감에 대해 종속 변수가 1(Y=1)이 되는 확률로 해석
 
12-3.로지스틱 회귀분석을 실습해보자 - 로지스틱 회귀분석 (4)
* 내가 가지고 있는 데이터로 따라해봐야지!

* jamovi > analysis > regression > binominal logistic regression

* 숫자인데 text로 읽히는 경우도 있어서 필요 시 데이터 속성 변경

  - norminal (명목척도), ordinal (순서척도), continuous (연속척도)
반응형



두 집단을 비교하는데에 t-test가 적합하다고 하여 번갯불에 콩구워먹듯이 공부를 했는데.

공부를 다하고도 몰랐다. 내가 가지고 있는 데이터에는 적합하지 않다는 것을.


자, 이제 공부했으니 데이터 분석을 해볼까, 하고 프로그램을 열고 가만- 생각해보니 뭔가 이상하다.

내가 가지고 있는 데이터(강점/보완점)는 명목 변수다.


값이 이항분포일 때에는 (유/무) t-test로 분석하기 어렵고 chi-square test를 해야한다고 한다.

치-스퀘어 테스트? 

,,, 카이 스퀘어 테스트였다. 


정말 울고 싶군 ㅋ





다행히, t-test 를 공부했던 유튜브 채널에 카이 스퀘어 테스트도 있다!


※학습노트

9-1. 카이제곱 검정에 대해 알아보자

* 음, 그런데 여기서는 독립 변수, 종속 변수 모두 명목 변수일 때 사용하는 것이 카이제곱 검정이라고 한다...!

  내가 가진 데이터의 독립 변수는 연속 변수인데 (...) 이미 시무룩

* 관찰된 빈도가 기대되는 빈도와 의미있게 다른지 검증하기 위해 사용

* 관찰 빈도는 자료, 기대 빈도는 개념적으로 기대하는 수치와 유사한 개념

* 테이블이나 그래프를 볼일은 많지 않음 


9-2. 일원 카이제곱 검정을 계산해 보자

* 일원 카이제곱 검정 (One-way) 

* 검정의 유의성이 의미하는 것은 무엇인가 다르다, 정도

  - 그래서 카이제곱 검정을 적합도라고 부르기도 한다.


9-3. 이원 카이제곱 검정을 계산해 보자3

* 이원 카이제곱 검정 (Two-way) 

* 두 변수 모두 명목 변수일 때, 두 변수 사이에 어떠한 연관성이 있는지 확인해보는 것

* 카이제곱 감정은 인과관계가 아니고 상관관계 (연관성이 있다,)

* 기대 빈도 = (행합계 x 열합계) / 총합계


9-4. 카이제곱 검정을 넘어서

의료계에서 많이 쓰이는 편 

* 각 셀의 기대빈도가 5이상이어야 함

*...오...먼말인지 몰라지는....모르겠다 아무튼, 한계가 많은 검정임...안되겠다...

* 상대위험도는 두 확률의 차이가 아니라 비율로 나타냄 

* 오즈(odds)란 어떤 확율이 일어날 확율 / 일어나지 않을 확율 (행열을 바꿔서 계산해도 오즈비는 거의 비슷) 

* 두 명목 척도인 변수가 연관성이 있을 경우, 상관계수를 구하는 방법 > Contingency coefficient (분할계수/c계수), Phi and Cremer's V

  변수가 순위 척도 & 연관성이 있을 경우, 상관계수를 구하는 방법 > Kendall's tau-b, Gamma


9-5. 카이제곱 검정을 실습해보자

* Jamovi > frequency에 있음

* 결과가 유의하게 나와도 통계적으로 유의미한 설명하기 어려움


ㅠ-ㅠ 큰일났다! 이것도 아닌 것 같다...

반응형

+ Recent posts