[학습노트][Edwith] 3분에 익히는 머신러닝의 기본 원리

많루 2021. 1. 3. 17:32

2021. 1. 3. 17:32

디지털 교육 설계를 위해 디지털 관련 개념을 이해해보기로 한다 ㅋㅋㅋㅋㅋㅋㅋ

디지털이라니 좋지만 싫을 것 같다. 싫지만 좋을거야 ㅠ-ㅠ

※ 학습 노트

학습 날짜	2020년 1월
학습 사이트	Edwith
과정 제목	3분에 익히는 머신러닝의 기본 원리
학습 시간	72강/941분
의견	- 짧은 영상 3개로 개념적인 설명만 제공 - 참고자료로 영상이 1-2개씩 추가되어있음 - 추가된 영상은 (내 기준) 갑자기 어려워지기도 하고 사운드가 안정적이지 않아서 듣기 힘들지만, 어차피 용어와 개념에 익숙해지려면 이것저것 여러번 들어야겠다는 생각에 1.5배속으로 1회 시청하였다 - 추가 영상 중 [리얼밸리 EP05] 머신러닝, 딥러닝 초간단 설명 추천!!! 개인적으로 머신러닝의 상세 내용보다는 기본 개념과 활용이 궁금했던터라 요정도가 딱 좋았을 수준 ㅎㅎ - 마지막 추가 영상까지 보고 느낀바는, edwith강좌를 개인 유튜브 채널, 블로그, meet-up 홍보용으로 활용한 것이 아닐까,,,싶었다. 뭐, why not ㅋ
학습 모듈	어려운 머신러닝, 쉽게 설명해드려요 머신러닝을 실전에 적용하려면? 딥러닝의 원리를 알아봅니다

어려운 머신러닝, 쉽게 설명해드려요

* 머신러닝이란 : 만들고 싶은 목표가 있고, 만드는 방법을 모르는 상황에서

해결 방법을 사람이 제시하는 것이 아니라 기계가 직접 시도하는 것을 반복한 후 적합한 방법을 만들도록 하는 기술

* 머신러닝 3요소 : 1) 경험 2) 성능지표 3) 작업목표 >> 3요소를 반복하며 정답에 가까워지는 것

* 머신러닝이 인공지능의 핵심 기술인 이유

- 인간이 지능을 재현하려는 인공지능은 방법은 모르지만 결과를 알고 있음

* 프로그래밍과 머신러닝의 차이

- 기존 컴퓨터는 프로그래밍을 통해 일일이 방법 하나하나를 코딩해줌

- 머신러닝은 컴퓨터 스스로 데이터를 학습해서 결과물을 만들어냄

* 소프트웨어 1.0 vs 소프트웨어 2.0

- 사람이 프로그래밍을 해주는 소프트웨어 1.0

- 기계 스스로 데이터를 통해 점점 발전하는, 소프트웨어 2.0

머신러닝을 실전에 적용하려면?

* 머신러닝의 5단계

1단계 데이터 수집 (collecting)

2단계 데이터 전처리(preprocessing) : 각기 다른 크기와 구도를 가진 데이터를 최대한 같은 포멧을 갖추도록 처리하는 과정

- 많은 경우 어떤 데이터가 어떤 결과물을 만드는지 패턴을 알려주는 과정인 레이블링(labeling)이 필요

3단계 피처추출(feature extraction): 작업 목표와 관계없는 불필요한 피처들을 버리고 중요도에 맞게 적절히 재구성하는 과정

- 딥러닝: 데이터를 쏟아 부어 피처 추출을 머신러닝에 맡기고자 하는 기술

4단계 학습 (training)

5단계 검증(validation)

딥러닝의 원리를 알아봅니다 (Feat.CNN)

* 머신러닝 차원의 저주: 데이터의 차원 (피쳐)의 수가 늘어날수록 필요한 데이터의 량은 제곱으로 많아짐

* 머신러닝 차원의 저주를 해결하기 위한 딥러닝 단계

CNN(Convolutional Neural Network) 이미지 필터링, 샘플링 반복 >> 저차원의 필터 생성 >> 여러 레이어 생성 >> 예측

◆

[추가 영상] 머신러닝, 1시간으로 입문하기

* What is machine learning

A computer program is said to learn from experience E with respect to come class of tasks T and performance measure P,

if its performance at tasks in T, as measured by P, improved with experience T - T.Michel(1997)

(예시) 축구 게임 전술을 위한 프로그램

T: 축구 게임에서 승리

P: 골

E: (x) 선수들의 움직임 (y) 평가

Task	Performance	Experience
분류 (classification)	0-1 loss function (에러가 발생했을 때 1의 에러를 더하는 방법)	labeled data
회귀 (regression)	L2 loss function (실제 값과 예측한 값의 거리의 합)	labeled data
군집 추출 (clustering)	군집의 중심에서의 거리	unlabeled data

* Machine learning process

1) Select a parametic / nonparametic model

2) Set a performance measurement including regularization term

3) Training data(optimizing parameters) until validation error increases

4) Evaluate the final performance using test set

* Regularization

- 현재를 잘 설명하면서 미래를 예측할 수 있는 모델 필요

- train data가 너무 딱 맞게 학습되면 과적합(over fitting)됨

- 데이터를 구분하는 선이 지나치게 복합해지지 않도록 곡률을 줄여주는 역할을 하는 factor를 cost 함수에 추가하는 것이 regularization

...어려워지고 있다...먼소린지 모르겠고...(먼산)

* Non parametric model: 모델없이 알고리즘을 자동으로 찾도록 하는것, 단점으로는 샘플이 훨씬 많이 필요함

- Support Vector Machine: 분류 규칙을 찾는 기법

- Gaussian Process Regression

마지막 몇 분은 아예 모르겠는 부분...ㅋ 그냥 꾸역꾸역 들어보았다 ㅋ

◆

[추가 영상] 머신러닝/딥러닝 강의 7가지 추천

* 양, 난이도, 정성, 커리큘럼, 추천자의 마음을 기준으로 7개 강의를 추천함

* Coursera, Udacity, youtube, stanford 등

◆

[추가 영상] [리얼밸리 EP05] 머신러닝, 딥러닝 초간단 설명 ★추천

* 일반적인 컴퓨터 사이언스: 사람이 찾아서 기계에 알려주는 것

머신 러닝: 데이터를 많이 주고 최소한의 모델을 제공하여 기계한테 직접 찾게 하는 것

딥러닝: 머신 러닝 방법 중 하나로, 모델 구조 중 사람의 뇌를 본딴 모델 구조를 사용

- 데이터가 방대해지고
- 인프라 스트럭처 레벨 기술 (GPU 사용, 빅데이터 처리 기술) 통해 인공신경망 훈련 가능해지며 두각을 드러내기 시작

- 현업에서는 최적화, 추천, 효율성을 높이는 문제에 굉장히 적용이 많이 되고 있음

◆

[추가 영상] 어머니에게 딥러닝(CNN, RNN, GAN)을 설명해보자 // 포럼IT 딥토크 이벤트

* CNN: 이미지 인식 분야에서 사용하는 알고리즘

이미지를 필터가 훑고 지나가면서 특징을 잡아냄

텍스트 인식에도 적용하고 있음

* RNN: 시계열 데이터, 미래 예측, 음성인식에 사용

* GAN(generative adversarial network)

◆

[추가 영상] [ART x TIPS] 인공지능 전문가, 스타트업을 만나다

* ...

저작자표시 (새창열림)

'공부' 카테고리의 다른 글

[학습노트][Coursera] Learning How to Learn (Week1) (0)	2021.07.04
[HRD] ESG 교육을 위한 정보 모음 (0)	2021.06.06
[학습노트][McKinsey Insight] 디지털 전략 (0)	2021.01.03
[학습노트][인프런] 데이터과학과 IT영역에서의 파이썬과 크롤링 큰 그림 이해하기 (2) (0)	2021.01.01
[학습노트][인프런] 데이터과학과 IT영역에서의 파이썬과 크롤링 큰 그림 이해하기 (0)	2020.12.28

거의 모든 것의 마니아

[학습노트][Edwith] 3분에 익히는 머신러닝의 기본 원리

'공부' 카테고리의 다른 글

+ Recent posts

티스토리툴바