데이터분석

데이터 분석 (3) - Pandas

xoos0420 2023. 5. 18. 17:12

1. 판다스(pandas)

  • '웨스 맥키니'가 개발한 라이브러리
  • 데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조(데이터프레임)를 제공하는 모듈

1-1. Series와 DataFrame

  • 2차원 표 데이터를 데이터프레임이라고 한다면, 1차원 표 데이터는 시리즈라고 함
  • 표의 데이터 부분을 values 라고 함
  • 표의 행이름을 index라고 부름
  • 표의 열 이름을 columns라고 부름
  • 시리즈는 values와 index로 이루어져 있고, 데이터프레임은 values, index, columns로 이루어져 있음
  • 데이터프레임과 시리즈의 value는 넘파이의 ndarray 기반
!pip install pandas
import pandas as pd

 

DataFrame 만들기

DataFrame(data, index, column)

df1 = pd.DataFrame(data1, index1, col1)

Series 만들기

 

딕셔너리를 사용하여 데이터프레임을 생성