반응형

데이터분석 4

판다스로하는 데이터분석 - DataFrame의 기본기능

판다스의 핵심이자 가장 기본인 DataFrame을 배워보자. DataFrame 생성하는 것부터, 어떤 기능들이 있는지 살펴볼 예정이다. 판다스로 하는 데이터분석의 시작 - DataFrame 1. DataFrame 생성하기 data = [['2020-01-01','150','google'],['2020-01-02','120','naver'], ['2020-01-03','110','naver'],['2020-01-04','125','daum'], ['2020-01-04','117','google']] 데이터프레임은 기본적으로 엑셀과 같은 테이블 형태다. 직접 데이터프레임을 만들 때에는 이렇게 행과 열의 수가 맞도록 리스트를 작성해주면 된다. data = pd.DataFrame(data) 데이터프레임으로 만들..

데이터 방 2020.05.10

판다스로하는 데이터분석 - Series와 DataFrame

약 2달간 'DSschool 이라는 데이터 사이언스 학원에서 강의를 들었었다. 수강을 한지 1년이 지났고 관련 분야에 몸을 담고있지도 않지만, 데이터 분석을 처음 배웠을 때 그 세계의 쇼킹함을 지금도 잊지 못하고 있다. 단순히 데이터분석 직종을 알게된 것이 아니라 세상을 바라보는 하나의 세계관을 배운 것이다. 끊임없이 의심하고 돌아보며, 객관적인 자료와 근거있는 상상력을 동원해 현상을 예측하고 분석하는 과정이 데이터분석의 굉장한 매력포인트다. 꼭 이 분야에서 일하지 않더라도 데이터분석을 배워놓으면 분명 삶의 질 또한 올라가리라 확신한다. 학원에서 배운 내용을 바탕으로, 기초부터 되짚어보는 과정을 밟아볼까 한다. 안하니 자꾸 까먹는다 ㅠㅠ 판다스로 하는 데이터분석의 시작, series와 dataframe ..

데이터 방 2020.05.10

데이터 분석 (체중 관리 2차)

문제정의 : 나는 왜 살이 안 찔까? 나의 하루 평균 섭취 칼로리에 적지 않은 충격을 받은 뒤 (1487kcal...) 1800kcal이상 먹기를 5/14일부터 시작했다. 나의 가설은 딱 하나 높은 칼로리->체중증가 딱 이것 하나만 지키려고 노력했다. 매일 1800kcal이상을 넘기진 못했지만 의식적으로 많이 먹으려고 노력했다. (여성 권장칼로리에 못 미치지만 한번에 2000kcal로 늘리는 것이 무리라 판단되어 일단 1800kcal로 정했다.) 그리고 실천한지 3주가 지났다. 검증해보자! [가설1] 지난 한 달(4/8-5/13)보다 지난 3주간 (5/14-6/5) 평균 몸무게가 더 높을 것이다. [검증] 먼저, 지난 한 달 평균이다. 칼로리: 1487kcal 체중(아침): 38.8kg 체중(저녁):39..

데이터 방 2019.06.07

데이터 분석 (체중 관리 1차)

이제 막 데이터 사이언티스 준비를 시작한 나에게 가장 쉽고 재밌게 데이터 분석을 할 수 있는 방법이 뭐가 있을까? 바로 생활데이터다. 김진영 데이터 사이언티스트의 '생활데이터 당장 시작하기' 를 읽고 생활데이터라는 것을 처음 접했다. 여러 사람들이 자신의 관심사를 바탕으로 데이터를 수집, 분석하고 자신만의 의미있는 결과를 도출한 사례들을 정말 흥미롭게 읽었다.그리고 나도 해보고싶다! 생활 데이터 시작하기 생활데이터 분석의 대상으로 빠지지 않고 등장하는 것이 바로 '삶의 질' 개선이다. 데이터를 다루는 사람이라면 자신의 일상을 데이터 분석 대상으로 삼아봤을 것이다. 삶의 질을 개선하기 위한 수단은 사람마다 다양할 것이다. 수면 질 높이기, 식단 관리하기, 체중 관리하기 등등. 자신의 수면 패턴, 식습관, ..

데이터 방 2019.06.02
반응형