반응형
- 노이즈가 문제를 발생시키는 경우 노이즈의 영향을 최소화해야함. 노이즈를 줄이는 절차를 스무싱이라고 부름.
- 스무싱 방법들을 알아보고자 함.
1. 구간의 평균을 이용한 스무싱 (smoothing with bin means)
- 전체를 몇개의 구간으로 나누고, 각 구간의 값들을 각 구간의 평균값으로 대체함.
- 예시) {1,3,5,8,9,15,18,21}을 두개의 구간 {1,3,5,8},{9,15,18,21} 으로 나눔. 각 구간의 평균은 4.25와 15.75이므로 이 값으로 대체함. {4.25,4.25,4.25,4.25,15.75,15.75,15.75,15.75} 로 스무싱됨.
2. 구간 경계값을 기주능로 한 스무싱 (smoothing with bin boundaries)
- 각 구간의 양 끝값을 유지하고, 나머지 값은 더 가까운 양 끝값중 하나로 변경함.
- 예시) {1,3,5,8,9,15,18,21}을 두개의 구간 {1,3,5,8},{9,14,18,21} 으로 나눔. 첫 구간의 양 끝값은 1과 8임. 나머지 값 중 3은 1에 가깝고, 5는 8에 가까우므로 3은 1로 5는 8로 변경. 다른 구간도 같은 로직 적용함. {1,1,8,8,9,9,21,21}로 스무싱됨.
3. 클러스터링을 사용한 스무싱 (smoothing by clustering)
- 클러스터링 후, 인스턴스들을 각 클러스터의 평균값으로 변경함.
4. 회귀를 사용한 스무싱 (smoothing by regression)
- 회귀분석 후, 인스턴스들을 회귀식의 값으로 변경함.
(참고문헌: Practical machine learning, Fred Nwanganga and Mike Chapple)
반응형
'Tips' 카테고리의 다른 글
신경망 부르는 방법 (0) | 2023.09.26 |
---|---|
[머신러닝] 민감도와 특이도의 의미를 기억하는 방법 (0) | 2023.09.05 |
[머신러닝] 릿지 회귀모델이란? (0) | 2023.09.04 |
[데이터분석] 정규화 방법들 (normalization) (0) | 2023.06.30 |
[데이터 분석] 결측치 처리 방법 (0) | 2023.06.29 |
댓글