728x90
LabelEncoder : 문자형태의 데이터로 구성된 피쳐를 수치화한다.
OneHotEncoder : 숫자로 표현된 범주형 데이터를 인코딩한다.
(단, 결과는 Sparse Matrix이므로 array로 만들거면 .toarray()해줘야한다.)
LabelEncoder & OneHotEncoder.pdf
OneHotEncoder(sparse=False, categorical_features=[2, 3, 8])
이렇게 하면, index가 2, 3, 8인 feature가 categorical임을 의미한다.
반응형
LIST
'Legacy > [Legacy] Machine Learning' 카테고리의 다른 글
타이타닉으로 그리드서치(GridSearch) (0) | 2019.06.03 |
---|---|
케라스로 mnist 인식하는 모델 만들기 (0) | 2019.06.01 |
Expected 2D array, got 1D array instead 에러 : flatten(), reshape(), ravel() 알아보기 (0) | 2019.02.23 |
교차검증 (cross-validation) (2) | 2019.02.15 |
feature engineering 특성공학(원핫인코딩, get_dummies, RFE) (0) | 2019.02.13 |