Notice
Recent Posts
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Archives
관리 메뉴

머뭇거릴 틈이 없다

혼자 공부하는 머신러닝+딥러닝 5주차 본문

혼자서 공부하는 ~시리즈

혼자 공부하는 머신러닝+딥러닝 5주차

HM_KIM_ 2021. 8. 8. 23:39

k-shield 주니어에 합격했습니다. 부족한 점이 많지만 무사히 이수할 수 있도록 열심히 살아야겠습니다..

 

k-평균 알고리즘)

 

처음에 랜덤하게 클러스터 중심을 정하고 클러스터를 만든다. 그 다음 클러스터의 중심을 이동하고, 다시 클러스터를 만드는 식으로 반복해서 최적의 클러스터를 구성하는 알고리즘

클러스터 중심 : k-평균 알고리즘이 만든 클러스터에 속한 샘플의 특성 평균값. 센트로이드라고도 부른다.

 

실행과정 참고자료- 출처 위키백과

 

선택 미션)ch06-3 문제 풀기

 

1번)

일반적으로 특성의 개수 만큼 주성분을 찾을 수 있다. 문제에서는 특성이 20개이므로, 해당 데이터 셋에서 찾을 수 있는 주성분의 개수는 2번 20개가 된다.

 

 

2번)

(1000, 100) 크기 데이터셋에서 10개의 주성분을 찾아 변환하면 샘플의 개수는 바뀌지 않고, 특성의 개수만 100에서 10개로 바뀐다. 답은 1번 (1000,10)

 

 

3번

주성분 분석은 가장 분산이 큰 방향부터 순서대로 찾을 수 있다. 그러므로 분산이 가장 큰 주성분은 맨 첫번째 주성분이 되므로, 답은 1번