일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 파이썬
- 문자열 함수
- search ads
- 디지털 검색광고
- b2b 마케팅
- 외장함수
- 양승화
- 퍼포먼스 마케팅
- PYTHON
- 오블완
- 검색광고 캠페인
- EXCEPT
- postgresql
- GA4
- 티스토리챌린지
- 데이터 전처리
- Def
- preprocessing
- dvdrental
- Pickle
- 머신러닝 입문 강좌 | TEAMLAB X Inflearn |
- sql
- dbeaver
- pgAdmin
- 숫자형
- 파이썬 코딩 무료 강의 (기본편) - 6시간 뒤면 여러분도 개발자가 될 수 있어요 [나도코딩]
- MAC
- inflearn
- ndarray
- google sa
- Today
- Total
목록Machine Learning (14)
Maron's DATA Log
1. 결측값 (NaN, Null 값) 허용 X 2. 문자열 값 (카테고리형 / 텍스트 형) 입력값으로 허용 X -> 숫자형으로 변환 인코딩 feature vectorization Data Encoding 1. Label Encoding : 카테고리 피처 -> 코드형 숫자값으로 변환 * 숫자 값은 크고 작음에 대한 특성이 작용해 일부 머신러닝 알고리즘에는 예측 성능이 떨 어질 수도 있음 레이블 인코딩은 선형 회귀와 같은 ML 알고리즘에서는 X, 트리 계열 ML 알고리즘은 괜찮음 from sklearn.preprocessing import LabelEncoder items = ['사과', '포도', '복숭아', '딸기'] encoder = LabelEncoder( ) encoder.fit(items) lab..
# Linear Regression (선형회귀) : 데이터들을 기반으로 하나의 함수를 구해 관찰되지 않은 데이터의 값을 예측 𝑦̂=𝑤0+𝑤1𝑥1+𝑤2𝑥2+⋯+𝑤𝐷𝑥𝐷=𝑤0+𝑤𝑇𝑥 * Feature : 독립변수, Target : 종속변수 * Polynomial Regression (다항회귀) 도 선형 회귀 (차수가 높아질수록 과적합의 문제가 크게 발생) * 선형 회귀/비선형 회귀을 나누는 기준은 회귀 계수가 선형/비선형인지 * Coefficients (회귀 계수) : 𝑤0 (기울기) 와 𝑤1...(절편) 을 회귀 계수로 지칭 * RSS, Residual Sum of Squares (잔차제곱합) - 회귀에서 cost (비용), 회귀 계수로 구성되는 RSS 는 비용함수 (loss function) * OLS,..
github.com/maron2ee/Machine-Learning/blob/main/%5B%EC%8A%A4%EB%B2%A0%EB%8D%B0%5D%203%EC%A3%BC%EC%B0%A8%20%EB%B3%B5%EC%8A%B5%20%EA%B0%95%EC%9D%98%20Example.ipynb maron2ee/Machine-Learning Contribute to maron2ee/Machine-Learning development by creating an account on GitHub. github.com 선형 대수 (Linear Algebra) : 벡터 공간, 벡터, 선형 변환, 행렬, 연립 선형 방정식 등을 연구하는 대수학의 한 분야 데이터 -> 선형대수학의 행렬 연산을 통해 표현 - 용어 * 스칼라 =..
# Confusion Matrix (혼동 행렬) 실제 | 예측 5 X_Negative (음성) 5 O_Positive (양성) 5 X_Negative (음성) TN : True Negative (진음성) FP : False Positive (가양성) 5 O_Positive (양성) FN : False Negative (가음성) TP : True Positive (진양성) # 머신러닝 모델의 성능 평가 1. TP (True Positive) : 맞는 것을 올바르게 예측 2. TN (True Negative) : 틀린 것을 올바르게 예측 3. FP (False Positive) : 틀린 것을 맞다고 잘못 예측 # 스팸 메일 구분 4. FN (False Negative) : 맞는 것을 틀렸다고 잘못 예측 # ..
# Gradient Descent (경사하강법) github.com/maron2ee/Machine-Learning/blob/main/ml04.ipynb maron2ee/Machine-Learning Contribute to maron2ee/Machine-Learning development by creating an account on GitHub. github.com # Decision Tree (의사결정나무) github.com/maron2ee/Machine-Learning/blob/main/ml05.ipynb maron2ee/Machine-Learning Contribute to maron2ee/Machine-Learning development by creating an account on Git..
github.com/maron2ee/Machine-Learning/blob/main/ml02.ipynb maron2ee/Machine-Learning Contribute to maron2ee/Machine-Learning development by creating an account on GitHub. github.com # 비지도학습 (Unsupervised Learning) : 레이블(정답)이 없이 진행되는 학습 // 학습할 때 데이터만 필요 데이터 자체에서 패턴을 찾아내야 할 떄 * 장점 : 따로 레이블을 제공할 필요 없음 * 단점 : 레이블이 없기 때문에 모델 성능을 평가하기는 다소 어려움 * 대표적인 예) 군집화, 차원축소 784 * 70,000 X[0] 784 * 1 X[0].reshape((..
github.com/maron2ee/Machine-Learning/blob/main/ml01.ipynb maron2ee/Machine-Learning Contribute to maron2ee/Machine-Learning development by creating an account on GitHub. github.com * 지도학습 (Supervised Learning) : 데이터와 함께 레이블(정답)이 제공되어 정답을 알려주면서 진행되는 학습 (정답, 실제값, 레이블, 타겟, 클래스, y값...) 주어진 데이터와 레이블을 이용해 새로운 데이터의 레이블을 예측할 때 사용 (예측값, 분류값, y-hat...) * 장점 : 데이터와 함꼐 레이블이 제공되어 손쉽게 모델의 성능을 평가할 수 있음 * 단점 : ..
github.com/maron2ee/Machine-Learning/blob/main/ml01.ipynb maron2ee/Machine-Learning Contribute to maron2ee/Machine-Learning development by creating an account on GitHub. github.com 머신러닝 기본 - 머신러닝 기본개념 이해 - 수학적 개념, 통계학 기초 리뷰 - Python 리뷰 - 머신러닝 도구 소개 (SciKit-Learn) - 딥러닝 도구 소개 (TensorFlow) 지도학습 -회귀/분류 - 머신러닝 알고리즘 개념 - 지도학습의 이해 - 선형회귀 (단순 / 다중) 개념의 이해와 구현 - 회귀모형 평가지표 - 로지스틱 회귀 개념 이해와 구현 - Naive Bay..