데이터분석

1일 1개발공부˙Day 1

묘걍 2022. 9. 24. 23:12

System.out.Girls 의 <99일 챌린지 : 1일 1개발 공부 인증>에 참여하게 되었고

그 첫 번재 게시글입니다!

개발 블로그도 처음 써보는 거라

개발 공부와 함께 개발 블로그 쓰는 요령도 배워가도록 하겠습니다ㅎㅎ

 

 

 

 

공부할 책

이것이 데이터 분석이다 - 한빛 미디어 / 윤기태 지음


chapter 00

1. 개발환경 구축하기

01. 아나콘다 설치

이미 돼있어서 패스

02. 주피터 노트북 설치

이미 설치돼있어서 패스

 

 

2.데이터 분석을 위한 라이브러리

01. 판다스 설치 및 활용

C드라이브 여유 공간이 부족해서

D드라이브에 설치하려고 했는데

작년에 데이터분석 수업을 들으면서 C드라이브에 설치된 게 남아있었다

 

판다스 라이브러리를 불러오는 방법

pd라는 이름으로 축약하여 사용

판다스 프레임 생성

데이터 프레임에 들어갈 두 개의 열 데이터(names, births)

list() 함수와 zip() 함수로 데이터셋 생성

head() 함수로 생성된 데이터프레임의 일부분을 살펴본다

데이터 프레임의 기본 정보 출력

dtypes는 열타입의 정보

index는 행 형태의 정보

columns는 데이터 프레임의 열 정보를 조금 더 간략한 형태로 요약

데이터 프레임에서 하나의 열 선택하기

데이터 프레임의 인덱스 선택하기

0~2번째 인덱스 선택

(책에 0~3번째 인덱스 선택이라고 돼있는데 오타 아닌가요..?)

조건을 추가하여 선택하기

births 열이 100보다 큰 데이터 선택

평균값 계산하기

결과는 나왔는데 경고가 뜸..

나중에 타입에러가 날 수도 있다는 말인가요..??

 

02. 넘파이 설치와 활용

넘파이 라이브러리 불러오기

넘파이 배열 생성하기

넘파이 배열 정보 확인하기

배열 데이터의 차원 확인

데이터 타입 확인

책에는 64로 나오는데 전 왜 32..?

0으로 채워진 넘파이 배열 생성

1로 채우려면 ones()

넘파이 배열 사칙 연산

 

03. Matplotlib

Matplotlib 라이브러리 불러오기

%matplotlib inline은 현재 실행중인 주피터 노트북에

그래프 출력 가능하도록

막대그래프 출력하기

bar: 막대그래프 객체 생성

xlabel: x축 제목

ylabel: y축 제목

title: 그래프 전체 제목

show: 그래프 출력

산점도 그래프

random.seed(): 랜덤 추출 시드를 고정

random.rand() 함수: 넘파이 배열 타입 난수 생성

arange(): 5 간격으로 0~100까지 숫자 생성

 

 

 

카페 마감 알바 끝나고 와서

급하게 시간 맞춰 올리느라

조금 허접한 포스팅이지만

앞으로 더 발전하기로 다짐하며

첫 번째 날 공부 끝-💕