데이터 정재 데이터 전처리의 중요성 데이터 분석과정에서 데이터 전처리는 반드시 거쳐야 하는 과정 결과에 직접적인 영향을 끼치므로 전처리는 반복적으로 수행해야한다. 데이터 전처리는 데이터 정제 -> 결측값 처리 -> 이상값 처리 -> 분석 변수 처리 데이터 정제의 개념 : 결측값을 채우거나 이상값을 제거하는 과정을 통해 데이터의 신뢰도를 높이는 작업. 데이터 정제 절차 : 오류 원인 분석 -> 정제 대상 선정 -> 정제 방법 결정 오류 원인 원인 결측값 : 필수적인 데이터가 입력되지 않음 노이즈 : 실제는 입력되지 않았지만 입력된것으로 판단된 것. 이상값 : 데이터 범위에서 튀는값.(기준에서 많이 벗어난 값) 정제 대상 선정 모든 대상을 기준으로 선정하는 것이 기본 특히, 데이터의 품질을 떨어트리는 데이터..