본문 바로가기
머신러닝을 위한 파이썬 기초/판다스

[파이썬 판다스] 범주형 문자열 데이터를 숫자형으로 바꾸는 법 (map 메소드)

by bigpicture 2023. 10. 10.
반응형

예시에 사용할 데이터를 먼저 불러옵시다. seaborn 패키지의 타이타닉 데이터를 불러오겠습니다. 

import seaborn as sns  
import pandas as pd

dt = sns.load_dataset('titanic')


sex 열은 값들이 문자열로 되어 있습니다. 

>>> dt['sex']
0        male
1      female
2      female
3      female
4        male
        ...
886      male
887    female
888    female
889      male
890      male
Name: sex, Length: 891, dtype: object


male을 1로, female을 0으로 바꾸겠습니다. map 메소드를 사용합니다. 

dt['sex']=dt['sex'].map({'male':1,'female':0})


결과는 아래와 같습니다 .

>>> dt['sex']
0      1
1      0
2      0
3      0
4      1
      ..
886    1
887    0
888    0
889    1
890    1
Name: sex, Length: 891, dtype: int64
반응형

댓글