데이터분석
데이터 분석 (3) - Pandas
xoos0420
2023. 5. 18. 17:12
1. 판다스(pandas)
- '웨스 맥키니'가 개발한 라이브러리
- 데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조(데이터프레임)를 제공하는 모듈
1-1. Series와 DataFrame
- 2차원 표 데이터를 데이터프레임이라고 한다면, 1차원 표 데이터는 시리즈라고 함
- 표의 데이터 부분을 values 라고 함
- 표의 행이름을 index라고 부름
- 표의 열 이름을 columns라고 부름
- 시리즈는 values와 index로 이루어져 있고, 데이터프레임은 values, index, columns로 이루어져 있음
- 데이터프레임과 시리즈의 value는 넘파이의 ndarray 기반
!pip install pandas
import pandas as pd
DataFrame 만들기
DataFrame(data, index, column)
df1 = pd.DataFrame(data1, index1, col1)
Series 만들기
딕셔너리를 사용하여 데이터프레임을 생성