Statistics
2022. 11. 27.
Oracle P-values and variable screening
p-value는 통계적 추론에서 중심적인 역할을 하며, 회귀분석에서 회귀계수에 대한 유의성을 판단할 때 사용된다. 고차원 데이터의 경우(np): t-분포를 통해 각 변수에 대한 p-value 계산. 2. high dimension(n SIS-1, SIS-2, LASSO) 3. Mimicking Oracle P-values 우리는 important variable set, $S^*$, 에 대해 알지 못하기 때문에, $S^*$을 추정해야 할 필요성이 존재한다. [key point] 여기에서 중요한 부분은 $S^*$를 잘 근사하는 집합을 확인하는 것이다. 먼저, $M_j$라는 새로운 집합에 대해 정의해 보고자 한다. 각각의 변수 $X_j$에 대하여, 우리는 다음과 같은 ideal approximation se..