[파이썬 판다스] 데이터프레임 인덱싱 방법 (인덱스 vs 이름)
먼저 판다스 데이터프레임을 하나 만들어봅시다. import pandas as pd L1=[[1,2,3],[4,5,6],[7,8,9],[10,11,12]] df=pd.DataFrame(L1,columns=['C1','C2','C3'],index=['R1','R2','R3','R4']) 만들어진 데이터프레임은 아래와 같습니다. >>> df C1 C2 C3 R1 1 2 3 R2 4 5 6 R3 7 8 9 R4 10 11 12 데이터프레임 인덱싱을 하는 상황은 아래와 같이 나뉩니다 1) 인덱싱 방법 : 인덱스 or 이름 2) 인덱싱 결과 : 행 or 열 or 복합 인덱싱 방법으로 큰 분류를 나누고, 각 방법 안에서 인덱싱 결과를 행, 열, 복합으로 출력하는 방법을 알아봅시다. 1. 인덱스를 사용하여 인덱싱 il..
2023. 9. 5.
[데이터분석] 스무싱 방법 (데이터 평활법)
- 노이즈가 문제를 발생시키는 경우 노이즈의 영향을 최소화해야함. 노이즈를 줄이는 절차를 스무싱이라고 부름. - 스무싱 방법들을 알아보고자 함. 1. 구간의 평균을 이용한 스무싱 (smoothing with bin means) - 전체를 몇개의 구간으로 나누고, 각 구간의 값들을 각 구간의 평균값으로 대체함. - 예시) {1,3,5,8,9,15,18,21}을 두개의 구간 {1,3,5,8},{9,15,18,21} 으로 나눔. 각 구간의 평균은 4.25와 15.75이므로 이 값으로 대체함. {4.25,4.25,4.25,4.25,15.75,15.75,15.75,15.75} 로 스무싱됨. 2. 구간 경계값을 기주능로 한 스무싱 (smoothing with bin boundaries) - 각 구간의 양 끝값을 유..
2023. 6. 30.