어떤 데이터를 가지고 분석을 하기 전에 가장 먼저 해야 할 것이 데이터 전처리다. (data cleaning 혹은 data preprocessing) 데이터 내의 정보는 그 자체로 raw(날 것) 데이터이기 때문에 분석에 필요하지 않은 정보가 담겨 있을 수도 있고 기록된 형식들이 통일되어 있지 않은 경우가 많다. (ex. 스타벅스/ starbucks/ STARBUCKS) 한마디로 정리가 되어 있지 않다. 데이터 전처리를 통해 데이터를 이쁘게 가공하는 과정이 필요하다. 내가 분석을 진행하면서 거쳤던 전처리를 정리해봤다. 주피터 노트북으로 실행했고 설명도 같이 있다. *pc화면에서 보시기를 권합니다.* github 소스코드 : https://github.com/seeinger/gain_weight_pjct ..