Machine Learning
2022. 10. 2.
분류용 가상 데이터 생성 -> sklearn.make_classification
sklearn package에는 분류(classifcation) 모형의 테스트를 위해 여러가지 데이터를 생성하는 함수를 제공해준다. 그 중 make_classification을 통한 가상의 데이터를 생성하는 코드를 정리해 보고자 한다. make_classification a. 인수 n_samples : 표본 데이터의 수(default=100) n_features : 독립 변수의 수(default=20) n_informative : 독립 변수 중 종속 변수와 상관 관계가 있는 성분의 수(default=2) n_redundant : 독립 변수 중 다른 독립 변수의 선형 조합으로 나타나는 성분의 수(default=2) n_classes : 종속 변수의 클래스 수(default=2) n_clusters_per_..