파이썬 (Python)/Pandas (DataFrame)

파이썬 판다스 :: 데이터프레임 DataFrame 생성, 기본정보 접근

옐루비(YellowBee) 2023. 5. 17. 14:05

DataFrame을 생성하고 조작하는 방법과 주요 함수들을 소개하려고합니다.

DataFrame의 생성

DataFrame을 생성하는 방법에는 여러 가지가 있습니다. 

가장 일반적인 방법은 다음과 같이 딕셔너리, 리스트, 배열 등의 데이터를 활용하여 생성하는 것입니다.

import pandas as pd

# 딕셔너리를 사용한 DataFrame 생성
data = {'Name': ['John', 'Alice', 'Kate'],
        'Age': [25, 28, 32],
        'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)

# 리스트를 사용한 DataFrame 생성
data = [['John', 25, 'New York'],
        ['Alice', 28, 'London'],
        ['Kate', 32, 'Paris']]
columns = ['Name', 'Age', 'City']
df = pd.DataFrame(data, columns=columns)
#행에는 data 값을 넣고 columns에는 변수를 대입하기

# 배열을 사용한 DataFrame 생성
import numpy as np
data = np.array([['John', 25, 'New York'],
                ['Alice', 28, 'London'],
                ['Kate', 32, 'Paris']])
df = pd.DataFrame(data, columns=columns)

DataFrame의 기본 정보 확인

DataFrame의 기본 정보를 확인하는 몇 가지 함수를 사용할 수 있습니다.

# DataFrame의 크기 확인 (행 x 열)
df.shape

# DataFrame의 요약 정보 확인
df.info()

# DataFrame의 컬럼 목록 확인
df.columns

# DataFrame의 상위 n개 행 확인 (기본값은 5)
df.head(n)

# DataFrame의 하위 n개 행 확인 (기본값은 5)
df.tail(n)

코딩테스트나 기사 실기시험에서도 주어진 자료의 기본정보를 활용하는 함수들이 자주 쓰입니다.

info(), head(), shape 함수들을 잘 숙지하면 좋을 것 같습니다.