반응형

전체 글 115

데이터 전처리 기초

어떤 데이터를 가지고 분석을 하기 전에 가장 먼저 해야 할 것이 데이터 전처리다. (data cleaning 혹은 data preprocessing) 데이터 내의 정보는 그 자체로 raw(날 것) 데이터이기 때문에 분석에 필요하지 않은 정보가 담겨 있을 수도 있고 기록된 형식들이 통일되어 있지 않은 경우가 많다. (ex. 스타벅스/ starbucks/ STARBUCKS) 한마디로 정리가 되어 있지 않다. 데이터 전처리를 통해 데이터를 이쁘게 가공하는 과정이 필요하다. 내가 분석을 진행하면서 거쳤던 전처리를 정리해봤다. 주피터 노트북으로 실행했고 설명도 같이 있다. *pc화면에서 보시기를 권합니다.* github 소스코드 : https://github.com/seeinger/gain_weight_pjct ..

데이터 방 2019.06.26

엄마의 독서 _ 정아은 3.5

프롤로그 "이 이야기는 애당초 엄마로서의 내 삶을 정리해보기 위해 틈틈이 썼던 소소한 기록에서 출발했다." "엄마라는 막중한 타이틀을 달게 되면서 나는 늘 그런책을 쓰고 싶었다. '엄친아'를 키워낸 완벽한 엄마가 다른 이들에게 비법을 전수해주는 책이 아닌, 어떻게 해야 좋은 엄마가 될 수 있는지 가르쳐주는 전문가들의 책이 아닌, 당사자의 경험이 새겨진 진솔한 책. 자신이 했던 실수와 못난 성정을 가감 없이 드러내고 경험에서 얻은 깨달음을 아낌없이 공유해주는 책." 정은아 작가는 14년 차 경력(2018년 기준)의 아들 둘 엄마다. 그는 자신 스스로를 대한민국 엄마들의 평균보다 훨씬 높은 수준의 극성스러움과 강박에 가까운 사교육을 향한 열망을 가졌던 엄마라고 말한다. 그는 아이를 키우는 것은 '방향을 알 ..

책방/비문학 2019.06.21

진화된 마케팅 : 그로스해킹 (1)

그로스해킹이란 무엇인가? 말 그대로 전통적인 마케팅 방법에서 벗어난, 진화된 마케팅 기법이다. 저자는 그로스해킹이라는 것이 무엇인지 정의하지 않은 채, 실제로 성장이 정체된 회사를 어떻게 키웠는지 구체적인 사례를 들며 이야기를 시작한다. 그로스해킹은 단 한 줄로 oo한 것 이라고 설명되지 않는다. 수많은 개념과 이해를 포함하고 있다고 말 할 수도 있다. 이 책은 크게 두 파트로 이루어져 있다. part 1. 그로스해킹 기법 (chapter1~4로 구성) 내용 : 그로스해킹의 프로세스/ 팀 구축/ 필요한 사람과 기술/ 아이디어 창출과 실험 방법 part 2. 그로스해킹 실행 전략 (chapter 5~9로 구성) 내용 : 고객유치 – 활성화 – 수익 창출 – 성장 – 가속 나는 이 중에서 의 앞부분만 정리 ..

책방/비문학 2019.06.17

빈 서판 _ 스티븐 핑커

2주 동안 이 책을 다 읽는데 실패했다. 최초로 독서모임의 모든 멤버들이 완독에 실패할 정도로 쉬운 책이 아니었다. 양도 양이지만 그냥 넘어갈 수 있는 문장이 하나 없고 계속해서 새로운 정보들이 쏟아져 나와 도저히 속도가 나질 않았다. 결국 마음을 내려놓고 ‘모든 것을 다 이해하려고 하지 말자. 적당히 넘길 건 넘기자’ 하고 타협을 봤다. 중간 분량을 지났을 때 쯤 부터 파트를 골라서 읽었다. 모든 내용을 다 탐독하려는 욕심을 냈다가는 제 풀에 지칠까봐 내가 내린 타협점이었다. 워낙 방대한 양이라(모든 파트를 다 읽지도 못했고) 이 중 생각할 거리를 던져줬던 핵심 부분을 다시 되짚어 보고자 한다. 빈 서판: ['인간의 마음은 백지와 같다. 고로 한 인간의 성격과 행동방식을 결정하는 것은 오로지 경험과 환..

책방/비문학 2019.06.11

데이터 분석 (체중 관리 2차)

문제정의 : 나는 왜 살이 안 찔까? 나의 하루 평균 섭취 칼로리에 적지 않은 충격을 받은 뒤 (1487kcal...) 1800kcal이상 먹기를 5/14일부터 시작했다. 나의 가설은 딱 하나 높은 칼로리->체중증가 딱 이것 하나만 지키려고 노력했다. 매일 1800kcal이상을 넘기진 못했지만 의식적으로 많이 먹으려고 노력했다. (여성 권장칼로리에 못 미치지만 한번에 2000kcal로 늘리는 것이 무리라 판단되어 일단 1800kcal로 정했다.) 그리고 실천한지 3주가 지났다. 검증해보자! [가설1] 지난 한 달(4/8-5/13)보다 지난 3주간 (5/14-6/5) 평균 몸무게가 더 높을 것이다. [검증] 먼저, 지난 한 달 평균이다. 칼로리: 1487kcal 체중(아침): 38.8kg 체중(저녁):39..

데이터 방 2019.06.07
반응형