카테고리 없음

데이터과학자와 데이터엔지니어를 위한 인터뷰 문답집

고장난 휴롬 2021. 2. 9. 15:14

1. 피처 정규화
min-max scaling : 0과1사이에 투영되도록 만든다
Z-score normalization : 데이터를 평균이 0이고 표준편차가 1인 분포로 투영되도록 만든다
선형회귀 로지스틱회귀 svm 신경망 -> 정규화를 해야함
의사결정트리 -> 정규화 필요 없음

2. 범주형 피처
순서형인코딩
원핫인코딩
이진인코딩

Bow - bag of words
Tf-idf
Topic modeling
Word embedding