데이터분석/이것이데이터분석이다 3

04 :: 탐색적 데이터 분석 소개

👉🏻 탐색적 데이터 분석 Raw 데이터가 있으면 이 Raw 데이터를 관찰하고 인사이트를 얻는다! ✅ 피처 요소들이 존재함 DataFrame 컬럼 하나하나를 피처라고 한다 키, 몸무게, 시력, 청력... 피처의 속성을 탐색하는 것 - 평균 키는 얼마인가? - 표준편차는 어떻게 되나? - 가장 큰 학생은 누구인가? 시각화를 통해 더 많은 인사이트를 얻음 - 눈으로 보면 상관관계 등이 더 잘 보인다 그 후 데이터에게 계속해서 질문함 - 몸무게가 제일 많이 나가는 10명은 누구인가? 등... 탐색적 데이터 분석이란? 데이터셋을 처음으로 살펴보고 데이터의 특성을 이해하며 패턴을 발견하는 과정 단계 데이터 불러오기 pandas 등을 통해 데이터를 불러온다 데이터 탐색 head(), info(), describe()..

02~03 :: Jupyter 노트북, Pandas 사용법 / Numpy, Matplotlib 사용법

👉🏻 주피터 노트북 사용 방법 ✅ 가상환경에서 주피터 노트북 열기 ✅ 파일 생성 - 주피터 노트북 UI 바뀌고나서는 처음이라 정확하진 않지만 이게 맞는 것 같다 - 이렇게 파일 창이 뜬다 - Home 화면에서 보면 생성된 것을 확인할 수 있다 🎮 코드(셀) 실행해보기 파이썬은 셀 단위로 실행할 수 있다 - 셀에 코드를 치고 - 단축키 shift + enter를 누르면 - 실행이 되면서 셀이 추가된다 - 아니면 Run에서 원하는 옵션을 선택해 실행할 수도 있다 🎮 셀 삭제 - 메뉴의 가위모양을 눌러 셀을 없앨 수 있다 - 단축키 설정을 통해 삭제할 수도 있다. 👉🏻 판다스 사용법 알아보기 🎮 판다스 import - 파이썬의 라이브러리를 가져오는 문법 - pd는 판다스를 앞으로 pd라는 축약어로 부르겠다는 ..

00 ~ 01 :: 왜 Data Science 인가? 탐색, 시각화, 목적 정리 및 분석 환경 구축하기 주피터 노트북, 아나콘다 설치

👉🏻 데이터 분석이란? 탐색 Row데이터에서 Insight를 발견하는것 Row 데이터 = 날것 그 자체의 데이터 이 데이터를 만지면서 특성 등을 발견하는 것 비즈니스, 개인적인 목적 등에 활용 시각화 (Visualize) 탐색으로 무언가 발견하면 나만 보는 것이 아니라 다른 사람도 볼 수 있게 더 잘 이해할 수 있게 됨, 더 좋은 생각을 하게 됨 목적 (Goal) 데이터분석에서는 목적을 잘 설정하는 것이 중요하다 목적 설정 방법이 있음 - 이 세가지 요소를 중점적으로 다룸 - 위 세가지를 염두하기!!! - 이 많은 것들의 각각을 배우는 것만 해도 몇달씩 걸릴 수도 있음 👉🏻 파이썬 위의 것들을 가장 쉽게, 가장 잘 하게 도와주는 도구 다른 프로그래밍 언어나 분석 도구에 비해 쉽게 따라할 수 있다 아주 쉽..