반응형
예시에 사용할 데이터를 먼저 불러옵시다. seaborn 패키지의 타이타닉 데이터를 불러오겠습니다.
import seaborn as sns
import pandas as pd
dt = sns.load_dataset('titanic')
결측치 확인을 해보면 age가 상당히 많이 비어 있는 것을 알 수 있습니다.
>>> dt.isnull().sum()
survived 0
pclass 0
sex 0
age 177
sibsp 0
parch 0
fare 0
embarked 2
class 0
who 0
adult_male 0
deck 688
embark_town 2
alive 0
alone 0
dtype: int64
age 열의 결측치를 평균으로 대체하는 방법은 아래와 같습니다. inplace 를 True로 놓으면 dt가 수정됩니다.
dt['age'].fillna(value=dt['age'].mean(),inplace=True)
결과는 아래와 같습니다.
>>> dt.isnull().sum()
survived 0
pclass 0
sex 0
age 0
sibsp 0
parch 0
fare 0
embarked 2
class 0
who 0
adult_male 0
deck 688
embark_town 2
alive 0
alone 0
dtype: int64
반응형
'머신러닝을 위한 파이썬 기초 > 판다스' 카테고리의 다른 글
[파이썬 판다스] 데이터프레임 특정 조건을 만족하는 특정 열에 접근하기 (0) | 2024.01.10 |
---|---|
[파이썬 판다스] 범주형 문자열 데이터를 숫자형으로 바꾸는 법 (map 메소드) (0) | 2023.10.10 |
[파이썬 판다스] 분할표 만드는 방법 (합계, 비율) (0) | 2023.10.09 |
[파이썬 판다스] 데이터프레임 여러줄 출력 하는 방법 (0) | 2023.10.06 |
[파이썬 판다스] 데이터프레임 특정 열을 기준으로 결측치 제거 (0) | 2023.09.15 |
댓글