Machine Learning/Clustering
2022. 9. 25.
DBSCAN을 통한 이상치 탐지
이번에 대회를 준비해보면서 데이터에 이상치가 존재한다고 판단되는데 이상치를 판단하는 기준을 iqr이 아닌 다른 방법을 조사해 보는중 군집분석을 통해서 이상치를 판단할 수 있다는 것을 알게 되었다. DBSCAN에 대해 공부한 내용을 토대로 정리해보고자 한다. DBSCAN(Density-Based Spatial Clustering of applications with noise) DBSCAN은 밀도 기반 비지도 학습이다. 한 공간에서 수많은 점이 있다고 가정한 경우, 낮은 밀도를 가진 지역에 있는 점들은 outlier로 판단한다. 이제 그 과정에 대해 살펴보도록 할 것이다. Hyperparameter hyperparameter로는 Epsilon과 Minpoint가 있다. Epsilon은 한 쌍의 점들 사이의..