반응형

데이터 분석 5

판다스 데이터 시각화 종류 (기초) _ matplotlib(seaborn)

(python에 있는 시각화 패키지 seaborn을 이용합니다) 데이터 불러오기 저는 캐글에 있는 타이타닉의 train.csv 데이터를 가지고 시각화 해보겠습니다. (타이타닉 데이터 다운로드하기) Titanic: Machine Learning from Disaster Start here! Predict survival on the Titanic and get familiar with ML basics www.kaggle.com 데이터 정보 : 타이타닉 사고 당시 생존자(Survived=1)와 사망자(Survived=0)의 정보가 나와있는 데이터입니다. 시각화 준비하기 시각화 패키지를 사용하기 위한 기본 세팅입니다. 사용할 데이터가 한글로 이루어져 있을 경우 아래와 같이 설정해주어야 합니다. 저는 윈도우 ..

데이터 방 2019.07.25

체중 변화 분석 ( +판다스 데이터 시각화)

나의 체중을 관리하면서 (체중 증량하기) 체중과 칼로리 이외에 체중과 관련이 있을것으로 예상되는 요소들을 같이 수집했다. 요소들은 다음과 같다. 밀가루 / 식사 및 간식 섭취 횟수 / 음식의 질(초록, 노랑, 빨강) / 장활동 / 걸음수 1. 칼로리와 체중 변화 제일 먼저 살펴볼 것은 칼로리에 따른 체중 증량 유무다. is_gained가 True(주황색) = 체중이 0.1kg이라도 증가한 날 is_gained가 False (파란색) = 체중이 증가하지 않거나 감소한 날 이 그래프는 체중이 증가하거나 그렇지 않은 날의 전체 건수를 보여주는데, 칼로리 섭취량에 따라 건수를 세분화했다. gained_weight = 증가한 체중(kg) 칼로리 섭취량이 높을 수록 살이 찐다는 것을 알 수 있다. 2. 음식의 질과..

데이터 방 2019.07.09

데이터 분석 (체중관리 3차)

문제 정의 : 나는 왜 살이 안 찔까? 나는 대학교 1학년을 마치고 난 후부터 1년 사이에 9kg가 빠져 지금까지 살이 다시 찌지 않는 상태에 있다. (데이터 분석을 시작하면서 조금씩 찌고 있기는 하다) 건강검진을 받았지만 아무 이상이 없게 나왔고 지금까지 이유를 모른다. 이유를 모른다고 해서 이유가 없는 것은 아니다. 하지만 이유를 모른다고 해서 다신 살을 찔 수 없는 것도 아니다. 나만의 가설과 분석, 실천으로 조금씩 체중 증가에 변화를 가져오고 있다. 7월이 되었다. 1차에서는 나의 평소 섭취 칼로리 분석했고 권장 칼로리보다 훨씬 못 미치게 섭취한다는 사실을 알았다. 2차에서는 평소보다 섭취량을 늘린 결과와 그 외 다양한 상관관계를 분석해 보았다. 3차에서는 6월 결과에 대해 분석해본다. 기간을 나..

데이터 방 2019.07.07

데이터 전처리 기초

어떤 데이터를 가지고 분석을 하기 전에 가장 먼저 해야 할 것이 데이터 전처리다. (data cleaning 혹은 data preprocessing) 데이터 내의 정보는 그 자체로 raw(날 것) 데이터이기 때문에 분석에 필요하지 않은 정보가 담겨 있을 수도 있고 기록된 형식들이 통일되어 있지 않은 경우가 많다. (ex. 스타벅스/ starbucks/ STARBUCKS) 한마디로 정리가 되어 있지 않다. 데이터 전처리를 통해 데이터를 이쁘게 가공하는 과정이 필요하다. 내가 분석을 진행하면서 거쳤던 전처리를 정리해봤다. 주피터 노트북으로 실행했고 설명도 같이 있다. *pc화면에서 보시기를 권합니다.* github 소스코드 : https://github.com/seeinger/gain_weight_pjct ..

데이터 방 2019.06.26

<헬로 데이터 과학> 김진영 5.0

최근에 데이터 분석에 관심을 갖게 되면서 브런치를 통해 ‘김진영’ 데이터 과학자를 알게 되었다. 당장 서점의 컴퓨터 과학 코너만 가도 널리고 널린 게 데이터 분석 책이다. 물론 모든 저자들이 진심과 열성을 다해 자신의 책을 썼겠지만 내가 브런치를 통해 읽은 그의 글에는 유난히 데이터를 향한 열정과 삶에 대한 사랑이 녹아 있었다. 그의 브런치, 블로그, 책을 읽을 때 마다 이상하게 그의 글을 읽는 것만으로 그가 어떤 사람인지 알 것만 같은 느낌이 든다. 그의 글에는 항상 진심이 느껴진다. 데이터 과학에 관심을 갖고 있는 사람이라면 꼭! 꼭! 강력 추천 x 100 한다. 이 책은 철자 그대로 ‘우리 모두’가 할 수 있는 생활 데이터 분석을 안내한다. 목차를 살펴보자. chapter 1. 데이터 과학 입문 c..

책방/비문학 2019.04.23
반응형