Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- ndarray
- 오블완
- 검색광고 캠페인
- 외장함수
- 퍼포먼스 마케팅
- google sa
- 파이썬 코딩 무료 강의 (기본편) - 6시간 뒤면 여러분도 개발자가 될 수 있어요 [나도코딩]
- postgresql
- 데이터 전처리
- 머신러닝 입문 강좌 | TEAMLAB X Inflearn |
- GA4
- PYTHON
- b2b 마케팅
- 디지털 검색광고
- search ads
- 문자열 함수
- 양승화
- EXCEPT
- inflearn
- 티스토리챌린지
- dbeaver
- MAC
- pgAdmin
- 숫자형
- 파이썬
- preprocessing
- Pickle
- sql
- Def
- dvdrental
Archives
- Today
- Total
목록preprocessing (1)
Maron's DATA Log
Data Preprocessing (데이터 전처리)
1. 결측값 (NaN, Null 값) 허용 X 2. 문자열 값 (카테고리형 / 텍스트 형) 입력값으로 허용 X -> 숫자형으로 변환 인코딩 feature vectorization Data Encoding 1. Label Encoding : 카테고리 피처 -> 코드형 숫자값으로 변환 * 숫자 값은 크고 작음에 대한 특성이 작용해 일부 머신러닝 알고리즘에는 예측 성능이 떨 어질 수도 있음 레이블 인코딩은 선형 회귀와 같은 ML 알고리즘에서는 X, 트리 계열 ML 알고리즘은 괜찮음 from sklearn.preprocessing import LabelEncoder items = ['사과', '포도', '복숭아', '딸기'] encoder = LabelEncoder( ) encoder.fit(items) lab..
Machine Learning
2020. 12. 22. 15:21