본문 바로가기

공부하는 날

[학습노트][Edwith] 3분에 익히는 머신러닝의 기본 원리


디지털 교육 설계를 위해 디지털 관련 개념을 이해해보기로 한다 ㅋㅋㅋㅋㅋㅋㅋ

디지털이라니 좋지만 싫을 것 같다. 싫지만 좋을거야 ㅠ-ㅠ 


※ 학습 노트

학습 날짜

 2020년 1월  

학습 사이트 

 Edwith

과정 제목

 3분에 익히는 머신러닝의 기본 원리

학습 시간

 72강/941분

의견

 - 짧은 영상 3개로 개념적인 설명만 제공

 - 참고자료로 영상이 1-2개씩 추가되어있음

 - 추가된 영상은 (내 기준) 갑자기 어려워지기도 하고 사운드가 안정적이지 않아서 듣기 힘들지만,
   어차피 용어와 개념에 익숙해지려면 이것저것 여러번 들어야겠다는 생각에 1.5배속으로 1회 시청하였다

 - 추가 영상 중 [리얼밸리 EP05] 머신러닝, 딥러닝 초간단 설명 추천!!! 

   개인적으로 머신러닝의 상세 내용보다는 기본 개념과 활용이 궁금했던터라 요정도가 딱 좋았을 수준 ㅎㅎ

 - 마지막 추가 영상까지 보고 느낀바는,
   edwith강좌를 개인 유튜브 채널, 블로그, meet-up 홍보용으로 활용한 것이 아닐까,,,싶었다. 뭐, why not ㅋ

 학습 모듈

 어려운 머신러닝, 쉽게 설명해드려요

 머신러닝을 실전에 적용하려면?

 딥러닝의 원리를 알아봅니다


어려운 머신러닝, 쉽게 설명해드려요

* 머신러닝이란 : 만들고 싶은 목표가 있고, 만드는 방법을 모르는 상황에서

                      해결 방법을 사람이 제시하는 것이 아니라 기계가 직접 시도하는 것을 반복한 후 적합한 방법을 만들도록 하는 기술

* 머신러닝 3요소 : 1) 경험 2) 성능지표 3) 작업목표 >> 3요소를 반복하며 정답에 가까워지는 것 

머신러닝이 인공지능의 핵심 기술인 이유

  - 인간이 지능을 재현하려는 인공지능은 방법은 모르지만 결과를 알고 있음

프로그래밍과 머신러닝의 차이

  - 기존 컴퓨터는 프로그래밍을 통해 일일이 방법 하나하나를 코딩해줌

  - 머신러닝은 컴퓨터 스스로 데이터를 학습해서 결과물을 만들어냄 

* 소프트웨어 1.0 vs 소프트웨어 2.0

- 사람이 프로그래밍을 해주는 소프트웨어 1.0 

- 기계 스스로 데이터를 통해 점점 발전하는, 소프트웨어 2.0 



머신러닝을 실전에 적용하려면?

머신러닝의 5단계

1단계 데이터 수집 (collecting)

2단계 데이터 전처리(preprocessing) : 각기 다른 크기와 구도를 가진 데이터를 최대한 같은 포멧을 갖추도록 처리하는 과정

         - 많은 경우 어떤 데이터가 어떤 결과물을 만드는지 패턴을 알려주는 과정인 레이블링(labeling)이 필요

3단계 피처추출(feature extraction): 작업 목표와 관계없는 불필요한 피처들을 버리고 중요도에 맞게 적절히 재구성하는 과정

        - 딥러닝: 데이터를 쏟아 부어 피처 추출을 머신러닝에 맡기고자 하는 기술

4단계 학습 (training)

5단계 검증(validation)



딥러닝의 원리를 알아봅니다 (Feat.CNN)

* 머신러닝 차원의 저주: 데이터의 차원 (피쳐)의 수가 늘어날수록 필요한 데이터의 량은 제곱으로 많아짐 

* 머신러닝 차원의 저주를 해결하기 위한 딥러닝 단계 

  CNN(Convolutional Neural Network) 이미지 필터링, 샘플링 반복 >> 저차원의 필터 생성 >> 여러 레이어 생성 >> 예측



[추가 영상] 머신러닝, 1시간으로 입문하기



* What is machine learning

  A computer program is said to learn from experience E with respect to come class of tasks T and performance measure P,

  if its performance at tasks in T, as measured by P, improved with experience T - T.Michel(1997)


(예시) 축구 게임 전술을 위한 프로그램

         T: 축구 게임에서 승리

         P: 골

         E: (x) 선수들의 움직임 (y) 평가

 

 Task

 Performance

 Experience

 분류 (classification) 

 0-1 loss function (에러가 발생했을 때 1의 에러를 더하는 방법)

 labeled data 

 회귀 (regression)

 L2 loss function (실제 값과 예측한 값의 거리의 합)

 labeled data

 군집 추출 (clustering)

 군집의 중심에서의 거리

 unlabeled data


* Machine learning process

1) Select a parametic / nonparametic model

2) Set a performance measurement including regularization term

3) Training data(optimizing parameters) until validation error increases

4) Evaluate the final performance using test set


* Regularization
   - 현재를 잘 설명하면서 미래를 예측할 수 있는 모델 필요 
   - train data가 너무 딱 맞게 학습되면 과적합(over fitting)됨 
   - 데이터를 구분하는 선이 지나치게 복합해지지 않도록 곡률을 줄여주는 역할을 하는 factor를 cost 함수에 추가하는 것이 regularization

...어려워지고 있다...먼소린지 모르겠고...(먼산)


Non parametric model: 모델없이 알고리즘을 자동으로 찾도록 하는것, 단점으로는 샘플이 훨씬 많이 필요함

  - Support Vector Machine: 분류 규칙을 찾는 기법

  - Gaussian Process Regression


마지막 몇 분은 아예 모르겠는 부분...ㅋ 그냥 꾸역꾸역 들어보았다 ㅋ



[추가 영상] 머신러닝/딥러닝 강의 7가지 추천

* 양, 난이도, 정성, 커리큘럼, 추천자의 마음을 기준으로 7개 강의를 추천함

* Coursera, Udacity, youtube, stanford 등



[추가 영상] [리얼밸리 EP05] 머신러닝, 딥러닝 초간단 설명 ★추천





일반적인 컴퓨터 사이언스사람이 찾아서 기계에 알려주는 것

  머신 러닝: 데이터를 많이 주고 최소한의 모델을 제공하여 기계한테 직접 찾게 하는 것

  딥러닝: 머신 러닝 방법 중 하나로, 모델 구조 중 사람의 뇌를 본딴 모델 구조를 사용

            - 데이터가 방대해지고
            - 인프라 스트럭처 레벨 기술 (GPU 사용, 빅데이터 처리 기술) 통해 인공신경망 훈련 가능해지며 두각을 드러내기 시작

- 현업에서는 최적화, 추천, 효율성을 높이는 문제에 굉장히 적용이 많이 되고 있음


 


[추가 영상] 어머니에게 딥러닝(CNN, RNN, GAN)을 설명해보자 // 포럼IT 딥토크 이벤트

* CNN: 이미지 인식 분야에서 사용하는 알고리즘

          이미지를 필터가 훑고 지나가면서 특징을 잡아냄

          텍스트 인식에도 적용하고 있음

* RNN: 시계열 데이터, 미래 예측, 음성인식에 사용

* GAN(generative adversarial network)



[추가 영상] [ART x TIPS] 인공지능 전문가, 스타트업을 만나다

* ...

반응형