데이터분석/이것이데이터분석이다

00 ~ 01 :: 왜 Data Science 인가? 탐색, 시각화, 목적 정리 및 분석 환경 구축하기 주피터 노트북, 아나콘다 설치

묘걍 2023. 12. 14. 20:18

👉🏻 데이터 분석이란?

  1. 탐색
    • Row데이터에서 Insight를 발견하는것
    • Row 데이터 = 날것 그 자체의 데이터
    • 이 데이터를 만지면서 특성 등을 발견하는 것
    • 비즈니스, 개인적인 목적 등에 활용
  2. 시각화 (Visualize)
    • 탐색으로 무언가 발견하면 나만 보는 것이 아니라 다른 사람도 볼 수 있게
    • 더 잘 이해할 수 있게 됨, 더 좋은 생각을 하게 됨
  3. 목적 (Goal)
    • 데이터분석에서는 목적을 잘 설정하는 것이 중요하다
    • 목적 설정 방법이 있음

- 이 세가지 요소를 중점적으로 다룸

- 위 세가지를 염두하기!!!

출처: 이데분 유튜브

- 이 많은 것들의 각각을 배우는 것만 해도 몇달씩 걸릴 수도 있음

 

👉🏻 파이썬

  • 위의 것들을 가장 쉽게, 가장 잘 하게 도와주는 도구
  • 다른 프로그래밍 언어나 분석 도구에 비해 쉽게 따라할 수 있다
  • 아주 쉽다
    • 어려운 데이터분석 개념이나 알고리즘도 코드 한 줄이면 실행되도록 개발되고 있다
    • Pandas, numpy, sklearn, teonsorflow 등의 라이브러리
  • 자료가 많다 (어마어마하게)
  • 모두가 쓰고 있다
    • 개발, 연구 모든 분야 가리지 않고 파이썬으로 통합되고 있다
    • 분산처리나 클라우드 등도 파이썬으로 손쉽게 개발되도록 진화중

* 왜? 가 중요하다!!

👉🏻 개발 환경 구축하기

🧩 아나콘다 설치하기

  • 데이터 분석 프레임워크

출처: 이데분 유튜브

  • 파이썬이라는 프로그래밍 언어에서 가상환경을 만들 수 있다
    • 가상환경: 라이브러리 등을 가상의 컴퓨터처럼 설치할 수 있게 해주는 관리 도구
    • 각각 다른 개발 환경이 구축되어있는 가상환경을 만들 수 있다
  • 그 안에 주피터 노트북 설치

  • 주피터 노특북: 웹브라우저에서 데이터분석을 간단하게 UI의 모습으로 코딩할 수 있게 도와주는 앱

--- 아나콘다는 이미 설치되어 있어서 설치 내용은 패스 ---

🎮 깃허브에서 예제 폴더 다운받기

https://github.com/yoonkt200/python-data-analysis

 

GitHub - yoonkt200/python-data-analysis: <이것이 데이터 분석이다 - 파이썬 편, 한빛미디어>의 예제입니다.

<이것이 데이터 분석이다 - 파이썬 편, 한빛미디어>의 예제입니다. 독자 여러분의 의견을 수렴하여 상시 업데이트 진행중입니다. - GitHub - yoonkt200/python-data-analysis: <이것이 데이터 분석이다 - 파이

github.com

- 폴더를 다운 받은 뒤 압축 해제

🧩 라이브러리 소개

✅ 판다스

  • 엑셀처럼 데이터를 행과 열의 형태로 구분지어 사용할 수 있도록 함
  • 파이썬 프로그래밍으로 엑셀 모양을 편하게 다루도록 해줌

✅ 넘파이

  • 벡터, 행렬 연산을 쉽게 도와줌
  • 입문시에는 많이 사용하지는 않음

✅ matplotlib

  • 판다스나 넘파이로 데이터를 정리를 한 뒤 정리된 데이터를 보기 좋게 시각화 해주는 라이브러리

🎮 아나콘다 프롬프트 실행하기

- 윈도우 검색창에 anaconda 검색

- 아나콘다 프롬프트 선택

🎮 가상환경 설치하기

(C드라이브 용량이 얼마 안 남아서 D드라이브에 설치)

✅ 파이썬 버전 확인하기

- 나는 충돌날 것을 우려하여 파이썬을 책처럼 3.7로 설치하지 않아서 파이썬 버전 확인이 필요했다

  1. window키 + R키 → cmd 검색을 통해 커맨드라인(명령 프롬프트)열기
  2. python --version 명령어 입력

✅ 가상환경 설치

- 가상환경 이름은 내가 설정 

- 중간에 계속 하겠냐고 물어보면 y

🎮 설치 확인하기

- conda env list를 입력하면

- 방금 만든 가상환경이 나온다

🎮 가상 환경 실행하기

- conda activate 가상환경 이름 으로 실행

- (base)가 (myogyang)으로 바뀌어있다

🎮 라이브러리 설치하기

✅ 주피터 노트북 설치하기

✅ 판다스 설치하기

✅ 넘파이와 맷플롯립 설치하기

- 연달아 쓰면 여러가지를 한꺼번에 설치할 수 있다

 

🎮 주피터 노트북 실행하기

- jupyter notebook이라고 치면

- url이 나온다

(바로 D드라이브가 안 나오고 C드라이브가 나와서 jupyter notebook --notebook-dir=D:\ 명령어가 필요했다)

 

 

 

 

 

 

 

 

출처: https://youtu.be/K0YPltIT7jc?si=phsvRHCUwdAc2s6_

https://youtu.be/nSEkwomMtxs?si=ZHOMdC_2OLLJHNQf