본문 바로가기

데이터 분석

[Edwith]모두를 위한 프로그래밍: 파이썬 자료구조 ※ 학습 노트 이런 강의가 있다. --- Data science from MIT Computer Science의 탑 1위 대학인 MIT 공대의 "Introduction to Computational Thinking and Data Science" 수업 영상 및 강의 자료를 한국어로 번역하여 여러분께 제공합니다.해당 강좌에서는 데이터 과학이라는 분야를 시작하기 위한 알고리즘과 통계학 그리고 기계학습의 내용을 조금씩 나눠서 다루고 있으며, 프로그래밍 실습보다는 문제 해결방법 대해서 집중적으로 공부합니다. 본격적인 데이터 과학 분야에 진입하기에 앞서, 해당 분야를 배우기 위해서는 어떤 것을 더 학습해야 하는지 체험할 수 있는 강의입니다. --- Edwith에서 수강할 예정이지만, MIT 강의라고 하니 글로벌 .. 더보기
[People Analytics] 로지스틱 회귀분석 역시 사람은 물어봐야한다. 끝없이 헤매고 있다가 작년에 피플 애널리틱스를 시작한 동료에게 하소연하였더니 로지스틱 회귀분석을 찾아보라고 한다. ※학습노트 * 로지스틱회귀분석(logistic regression analysis) - 이항 로지스틱 회귀(binominal regression analysis) 종속변수의 범주 수가 2개 일 경우 - 다항 로지스틱 회귀(binominal regression analysis) 종속변수의 범주 수가 3개 이상일 경우 * 큰 값 (연구 관심 결과인 '있음')에 해당하는 경우로 분류될 확률 * Odds(비) Odds ratio (비의 비율) 로짓(Odds에 로그) 12-1. 로지스틱 회귀분석이란? - 로지스틱 회귀분석 (1) * OLS 회귀 분석은 종속 변수가 nomin.. 더보기
[People Analytics] 종속 변수가 명목 변수일 때, 카이제곱 검정 두 집단을 비교하는데에 t-test가 적합하다고 하여 번갯불에 콩구워먹듯이 공부를 했는데.공부를 다하고도 몰랐다. 내가 가지고 있는 데이터에는 적합하지 않다는 것을. 자, 이제 공부했으니 데이터 분석을 해볼까, 하고 프로그램을 열고 가만- 생각해보니 뭔가 이상하다.내가 가지고 있는 데이터(강점/보완점)는 명목 변수다. 값이 이항분포일 때에는 (유/무) t-test로 분석하기 어렵고 chi-square test를 해야한다고 한다.치-스퀘어 테스트? ,,, 카이 스퀘어 테스트였다. 정말 울고 싶군 ㅋ 다행히, t-test 를 공부했던 유튜브 채널에 카이 스퀘어 테스트도 있다! ※학습노트9-1. 카이제곱 검정에 대해 알아보자* 음, 그런데 여기서는 독립 변수, 종속 변수 모두 명목 변수일 때 사용하는 것이 카.. 더보기
[People Analytics] 급해서 찾아보는 t-test(t검정) 데이터 분석력 0인데 숙제는 해야하는 상태 조직 특성(구성)에 따라 리더십 진단 결과에 차이가 있는지 분석하기로 하였는데, 리더십 진단 결과가 점수가 아니라 강점과 보완점이다. 하여, 특정 리더십 역량이 강점 또는 보완점으로 나온 집단과 그렇지 않은 집단을 비교해보기로 하고 두 집단을 비교하는 t-test를 공부해보기로함 뭐하고 있는지도 모르겠으나, 하다보면...길이 나오려나...ㅠ 우선 유튜브에서 듣기 편한 영상을 찾았고, 2편까지 보고, 정리하면서 보면 좋을 것 같아서 블로그를 열었다 학습하기에 좋은 영상은 - 속도가 적절하고 (영상 속도 조절만으로는 어려운, 말의 템포 &스타일이 있다) - 내용에 차근차근 접근하며 (나는 진짜 똥멍청이급 초보니까) - 예시를 잘 들어주는 특징이있는 것 같다 아무튼,.. 더보기