Chapter 7. 통계 기반 머신러닝 2 - 자율 학습과 지도 학습

이 문서는 한빛미디어에서 나온 처음 배우는 인공지능 을 공부하면서 정리한 것이다.

Authors:Woong Jeong

01 자율 학습

자율 학습

* 학습(學習)
사전적 의미 - 배움이라고도 하며, 직/간접적인 경험이나 훈련에 의해 지속적으로 지각하고, 인지하며, 변화시키는 행동 변화를 말합니다.
기계학습에서의 의미 - 계산을 반복하면서 가중치 계수를 업데이트해서 모델이 되는 기저 함수(바탕함수, basis function)와 분포에 가깝게 나타내는 것을 의마합니다.
* 자율 학습(Unsupervised Learning)
정답이 주어지지 않은 상태에서 학습을 통해 모델을 만드는 것. 통계에서 밀도 추정(Density Estimation)과 깊은 연관이 있다고 합니다.
클러스터 분석, 차원 압축 등을 주로 이용하여 그림으로 결과를 나타내는 등 사람이 데이터의 특징을 파악하기 쉽게 해주는 데이터 마이닝 기법이라고 할 수 있습니다.
alternate text

클러스터 분석과 K-평균 알고리즘

클러스터 분석(Cluster analysis)은 자율학습의 대표적인 접근 방법입니다. 주어진 데이터들의 특징에 그룹을 나누고 대표적인 특징을 찾아내는 방법입니다.
이를 통해 수 백만개의 데이터를 직접 확인하지 않고도 클러스터의 대표값만 확인하여 전체 데이터의 특징을 확인할 수 있습니다.
클러스터 분석의 대표적인 방법은 K-means알고리즘이 있습니다.
[k그룹 설정] -> [무작위 할당] -> [각 점에서 무작위로]
alternate text

주성분 분석

특이값 분해

독립 성분 분석

자기조직화지도

02 지도 학습

서포트 벡터 머신

베이즈 필터와 단순 베이즈 분류

ID3

랜덤 포레스트

타당성 검증

식별 모델의 평과오 ROC 곡선

ROC 곡선을 이용한 평가

홀드 아웃 검증과 교차 검증

02 텐서플로를 이용한 K-평균 예제

필요한 모듈 불러오기

데이터 정의하기

K-평균 그래프 생성하기

그래프 실행하기

시각화해 보여주기