본문 바로가기

인공지능(AI)/코드잇_머신러닝

[머신 러닝 기본기] 머신 러닝이란?

- 데이터가 많아지고, 컴퓨터 성능이 좋아지고, 머신러닝의 활용성이 증명되어서 머신러닝은 핫해졌습니다.

 

- 딥러닝은 머신 러닝 기법 중 하나입니다. 층이 "깊어"진다.->"딥"러닝

 

 

- 머신 러닝은 지도 학습, 비지도 학습, 강화 학습 3가지로 분류됩니다.

 

- 지도 학습(Supervised learning)은 "답"이 있고, 이 답을 맞추는 게 학습의 목적입니다. 비지도학습에는 답이 없습니다.

 

- 지도 학습에는 분류(Classfication)와 회귀(Regression) 2가지가 있습니다. 분류는 스팸인가 아닌가 하는 문제이고, 회귀는 무수히 많고, 연속적인 값 중에서 답을 찾는 문제입니다.

 

- 지도 학습을 할 때에는 학습 데이터의 답을 꼭 정해줘야 합니다.

 

- 비지도 학습에는 "답"이 없고 이 답을 맞추는 게 학습의 목적입니다. 프로그램이 정답 없이 "비슷한" 기준대로 묶는 것이 그 예입니다.

 

- K-Nearest Neighbors Algorithm(k-최근접 이웃 알고리즘)을 살펴보면, 가장 가까운 점들을 토대로, 정답을 추정합니다. 더 많은 경험을 하면 kNN 알고리즘 성능이 좋아지므로 이는 머신러닝입니다.

 

- 머신러닝은 컴퓨터 과학 분야이면서, 수학 분야(선형대수, 미분, 통계, 확률)이기도 합니다. 선형대수학의 행렬은 많은 데이터를 묶고, 계산을 효율적으로 할 수 있게 해줍니다. 미적분학은 머신러닝에서 최적화를 할 때 사용됩니다. 그리고 통계는 많은 데이터의 특징을 파악하는데 사용되며, 확률은 가능성을 분석하는데 사용됩니다.