Maron's DATA Log

Day 3_비지도학습 / MNIST (손글씨) / Classification (분류) 본문

Machine Learning/Python기반 머신러닝 데이터분석 실무과정

Day 3_비지도학습 / MNIST (손글씨) / Classification (분류)

maron2ee 2020. 12. 5. 10:55

github.com/maron2ee/Machine-Learning/blob/main/ml02.ipynb

 

maron2ee/Machine-Learning

Contribute to maron2ee/Machine-Learning development by creating an account on GitHub.

github.com

 

 

# 비지도학습 (Unsupervised Learning)

: 레이블(정답)이 없이 진행되는 학습 // 학습할 때 데이터만 필요

데이터 자체에서 패턴을 찾아내야 할 떄

 

* 장점 : 따로 레이블을 제공할 필요 없음

* 단점 : 레이블이 없기 때문에 모델 성능을 평가하기는 다소 어려움

* 대표적인 예) 군집화, 차원축소

 

 

784 * 70,000

         
         
         
         
         
         
         
         
         
         

X[0]

784 * 1 

           

X[0].reshape((28, 28))

28 * 28

         
         
         
         
         

 

color image 는 3차원 28*28 뒤에 R/G/B 큐브 모양

 

y_train_5 (real)

T F F F F

y_train_5_pred (예측)

T F F T F

 

==

T T T F T
1 1 1 0 1

= 4/5 = 80%

 

 

 

# Confusion Matrix

실제 | 예측 5 X_Negative (음성) 5 O_Positive (양성)
5 X_Negative (음성) TN : True Negative (진음성) FP : False Positive (가양성)
5 O_Positive (양성) FN : False Negative (가음성) TP : True Positive (진양성)

1. TP (True Positive) : 맞는 것을 올바르게 예측

2. TN (True Negative) : 틀린 것을 올바르게 예측

3. FP (False Positive) : 틀린 것을 맞다고 잘못 예측     # 스팸 메일 구분

4. FN (False Negative) : 맞는 것을 틀렸다고 잘못 예측    # 코로나 진단키트

 

 

 

 

 


비지도학습 -Clustering / Association Rule

-비지도학습의 이해
-군집분석(Clustering) 이해
-agglomerative clustering (병합 군집)
-K-means (K-평균)
-DBSCAN
-Association Rule (연관성 규칙)의 개념 이해
-Association Rule 평가지표 계산활용

딥러닝학습

-딥러닝의 이해 (TensorFlow)
-CNN과 RNN의 이해

 

 

 

Comments