Priceless

[ML] 혼자 공부하는 머신러닝+딥러닝 Ch.6 본문

AI/ML

[ML] 혼자 공부하는 머신러닝+딥러닝 Ch.6

Hyun__ 2023. 8. 29. 11:30

Ch.6 비지도 학습

6-1. 군집 알고리즘

비지도 학습

비지도 학습: 타킷을 모르는 데이터를 예측하는 알고리즘

흑백 샘플이미지의 경우 높은 값을 낮은 값으로 만들고 낮은 값을 높은 값으로 만든다

 

비지도 학습을 통한 이미지 분류

이미지outline으로 나누어진 이미지의 픽셀만 남게 한다

평균을 내어 데이터 개수 별로 구간을 나누어 확인하는 방법

이 방법의 경우 평균이 비슷한 데이터끼리 솎아낼 수 없다

 

대신 각 픽셀 별로 평균을 내는 경우 그만큼 특징이 많아져서 구별하기 수월하다

 

평균값을 각 이미지에서 뺀 후 차이가 적은 순으로 해당 이미지 인것을 확인할 수 있다

 

군집: 비슷한 샘플끼리 그룹을 모으는 작업

클러스터: 군집을 통해 생성된 그룹

 

비슷한 샘플끼리 모으기

 

6-2. k-평균

k-평균 알고리즘

k-평균 알고리즘: 평균값이 중간에 있기 때문에 평균값을 통해 군집을 구하는 알고리즘

 

k-평균 알고리즘 과정

1. 무작위로 k개의 클러스터 중심을 정한다

2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다

3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경한다

4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복한다

 

최적의 k 찾기

실전에서는 몇 개의 클러스터가 있는지 알 수 없다

이너시아: 클러스터 중심과 샘플 사이의 거리의 제곱 합

엘보우: 이너시아가 급격히 꺾이는 부분

 

6-3. 주성분 분석

차원과 차원 축소

차원 축소: 데이터를 가장 잘 나타내는 특성을 선택하여 데이터 크기를 줄인다

지도 학습 모델의 성능이 향상된다

주성분 분석: 손실을 최대한 줄이면서 복원하는 차원 축소 알고리즘

(PCA, Principal Component Analysis)

 

주성분 분석

주성분: