본문 바로가기
머신러닝을 위한 파이썬 기초/판다스

[파이썬 판다스] 결측치 평균으로 대체하기

by bigpicture 2023. 10. 10.
반응형

예시에 사용할 데이터를 먼저 불러옵시다. seaborn 패키지의 타이타닉 데이터를 불러오겠습니다. 

import seaborn as sns  
import pandas as pd

dt = sns.load_dataset('titanic')


결측치 확인을 해보면 age가 상당히 많이 비어 있는 것을 알 수 있습니다. 

>>> dt.isnull().sum()
survived         0
pclass           0
sex              0
age            177
sibsp            0
parch            0
fare             0
embarked         2
class            0
who              0
adult_male       0
deck           688
embark_town      2
alive            0
alone            0
dtype: int64


age 열의 결측치를 평균으로 대체하는 방법은 아래와 같습니다. inplace 를 True로 놓으면 dt가 수정됩니다. 

dt['age'].fillna(value=dt['age'].mean(),inplace=True)


결과는 아래와 같습니다. 

>>> dt.isnull().sum()
survived         0
pclass           0
sex              0
age              0
sibsp            0
parch            0
fare             0
embarked         2
class            0
who              0
adult_male       0
deck           688
embark_town      2
alive            0
alone            0
dtype: int64
반응형

댓글