데이터분석/DACON 3

[Basic 펭귄 몸무게 예측 - EDA] 초보자를 위한 상세 설명

[EDA] 데이터 분석 입문자를 위한 데이터 살펴보기 - 시작하기 전에 - 구글 코랩으로 데이콘 제출하기 https://colab.research.google.com/?hl=ko Google Colaboratory colab.research.google.com 여기서부터 진행되는 튜토리얼인데 나는 그냥 내 드라이브에서 폴더를 만들고 생성했다 구글 드라이브에서 새로 만들기 클릭 (혹은 화면상에서 마우스 오른쪽 클릭) 새폴더 클릭 폴더 명을 설정하고 만들기를 클릭하면 폴더 생성됨 폴더 내부로 이동하여 마우스 오른쪽 - 더보기 - 구글 코랩 이렇게 하면 새로운 코랩 파일을 생성할 수 있는데 지금은 다운 받은 파일이 있기 때문에 다운 받은 파일을 끌어다 놓는다. (그 외에 여러가지 방법으로 폴더에 파일을 옮김)..

판다스 첫걸음

1️⃣판다스 * Pandas * - 파이썬 데이터 처리를 위한 라이브러리이다. - 파이썬을 이용한 데이터 분석과 같은 작업에서 필수적인 라이브러리 👉🏻판다스의 기능 - 공식 깃헙에서 본인들을 "관계형" 또는 "레이블된" 데이터를 쉽고 직관적으로 조작할 수 있도록 설계된 파이썬 패키지라고 설명한다. 통합 인덱싱으로 데이터를 조작할 수 있는 데이터 프레임 다양한 데이터 구조와 파일 형식 지원 대규모 데이터 분류, 슬라이싱, 인덱싱 데이터의 통계 및 시각화 데이터 형태 변경, 삭제 및 추가 데이터 그룹화, 정렬, 결합, 필터링 데이터 셋 병합 시계열/ 문자열 데이터 지원 - 판다스는 데이터를 구조화하고 처리하는데 유용한 기능을 제공한다 - 데이터를 표 형태로 표시하거나, 데이터를 정렬하거나, 데이터를 그룹화하..

[Pandas튜토리얼]Ch1. CSV파일과 DataFrame

데이터의 종류 비정형 데이터 - 텍스트, 사진, 소리 ... - 형태가 없는 데이터 정형 데이터 - 행과 열로 구분하여 표에 기록된 데이터 - 기상, 주가, 대출 등 가치있는 데이터들은 정형 데이터로 수집 및 보관됨 - 분석에서도 가장 많이 사용됨 "판다스는정형 데이터를 다루는 패키지이다" 정형 데이터 더 알아보기 CSV - 정형 데이터의 대표적 저장 방식 - 행은 줄바꿈을 이용해 구분하고 - 열은 쉼표를 이용해 구분한다 - 간단한 규칙 덕분에 메모장 같은 프로그램으로도 생성 가능 예) - 메모장에 위와 같이 작성하고 확장자를 csv로 저장 실습 https://dacon.io/competitions/official/235605/codeshare/936?page=1&dtype=recent&ptype=pub..