본문 바로가기
Tips

[데이터분석] 스무싱 방법 (데이터 평활법)

by bigpicture 2023. 6. 30.
반응형

- 노이즈가 문제를 발생시키는 경우 노이즈의 영향을 최소화해야함. 노이즈를 줄이는 절차를 스무싱이라고 부름. 
- 스무싱 방법들을 알아보고자 함.

 

1. 구간의 평균을 이용한 스무싱 (smoothing with bin means)

- 전체를 몇개의 구간으로 나누고, 각 구간의 값들을 각 구간의 평균값으로 대체함. 
- 예시) {1,3,5,8,9,15,18,21}을 두개의 구간 {1,3,5,8},{9,15,18,21} 으로 나눔. 각 구간의 평균은 4.25와 15.75이므로 이 값으로 대체함. {4.25,4.25,4.25,4.25,15.75,15.75,15.75,15.75} 로 스무싱됨. 

 

2. 구간 경계값을 기주능로 한 스무싱 (smoothing with bin boundaries)

- 각 구간의 양 끝값을 유지하고, 나머지 값은 더 가까운 양 끝값중 하나로 변경함. 
- 예시) {1,3,5,8,9,15,18,21}을 두개의 구간 {1,3,5,8},{9,14,18,21} 으로 나눔. 첫 구간의 양 끝값은 1과 8임. 나머지 값 중 3은 1에 가깝고, 5는 8에 가까우므로 3은 1로 5는 8로 변경. 다른 구간도 같은 로직 적용함. {1,1,8,8,9,9,21,21}로 스무싱됨. 

 

3. 클러스터링을 사용한 스무싱 (smoothing by clustering)

- 클러스터링 후, 인스턴스들을 각 클러스터의 평균값으로 변경함.

 

4. 회귀를 사용한 스무싱 (smoothing by regression)

- 회귀분석 후, 인스턴스들을 회귀식의 값으로  변경함. 

 

 

(참고문헌: Practical machine learning, Fred Nwanganga and Mike Chapple)

반응형

댓글