1. Motivate
본 내용에서 다루고자 하는 주 내용은 count time series를 일반화 선형 모형(Generalized Linear Model: GLM) 접근방법을 이용해 모델링하여 temporal correlation에 대한 파악과 count data $Y_t$에 대한 이산형 주변 분포(discrete marginal distribution)를 구하고자 합니다. Count time series가 포아송 조건부 분포(Poisson conditional distribution)와 음이항 조건부 분포(Negative Binomial conditional distribution)를 따르는 경우에 대해 다룹니다.
2. Background
본 section 2에서는 포아송 분포(Poisson distribution)와 음이항 분포(Negative Binomial) 및 일반화 선형 모형(Generalized Linear Model: GLM)에 대해 살펴보고자 합니다.
2.1 Poisson Distribution
포아송 분포는 단위 시간 안에 특정 사건이 일어난 횟수에 대해 모델링할 때 사용됩니다.
$$ \begin{align*}
Y \sim Pois(\lambda), \, \, \lambda > 0, \, \, y=0,1,2, \cdots
\end{align*} $$
단위 시간 안에 특정 사건이 일어날 횟수에 대한 기댓값을 $\lambda$라고 했을 때 그 사건이 $y$회 일어날 확률은 다음과 같습니다.
$$ \begin{align*}
P(Y=y) = \dfrac{exp(-\lambda)\lambda^y}{y!}, \, \, E[Y] = Var[Y] = \lambda
\end{align*} $$
포아송 분포의 경우 기대값과 분산이 모두 $\lambda$로 두 값이 같다는 중요한 특성이 존재합니다.
2.2 Negative Binomial Distribution
만약 $Var(Y) > E[Y]$인 경우는 과대산포(over-dispersion)에 대해서 고려하여야 합니다. 이에 대하여 감마 분포(Gamma distribution)를 따르는 $z$가 주어졌을 때 $Y$의 조건부 분포(conditional distribution)는 포아송 분포인 포아송 감마 혼합 분포(Poisson Gamma Mixture Distribution)을 고려할 수 있습니다.
$$ \begin{align*}
Y|z \sim Pois(\lambda z) \\
z \sim Gamma(a,b), \\
\end{align*} $$
- 형태모수(shape parameter) $a>0$, 척도모수(scale parameter) $b>0$
- $E(Y|z) = Var(Y|z) = \lambda z$, $E(z) = ab, \, Var(z) = ab^2$
$Y$의 평균이 $\lambda$가 되도록 보장하기 위해서($E[Y]=\lambda$), 감마분포의 파라미터 각각을 $a=\nu$와 $b = \dfrac{1}{\nu}$로 정의하면 $Y$의 주변 분포는 음이항 분포를 따릅니다.
$$ \begin{align*}
Y \sim NegBin(\lambda, \nu)
\end{align*} $$
$$ \begin{align*}
f(y;\nu) = \int^\infty_0 f(y|z)f(z;\nu)dz = \dfrac{\Gamma(\nu+y)}{\Gamma(y+1)\Gamma(\nu)} (\dfrac{\nu}{\nu + \lambda})^\nu (\dfrac{\lambda}{\nu+\lambda})^y
\end{align*} $$
$Y$의 평균과 분산은 각각 $E[Y]=\lambda$, $Var[Y]=\lambda + \lambda^2/\nu$이며 분산을 확인해보면 $\lambda$에 식 $\lambda^2/\nu$ 이 추가된 것을 확인할 수 있습니다. 즉, $Var[Y] > E[Y]$로 과대산포에 대해서 고려하였음을 알 수 있습니다.
2.3 Generalized Linear Model
일반화 선형 모형(GLM)이란 $X = (X_1,X_2, \cdots, X_p)$가 주어졌을 때 반응변수 $Y$의 기댓값 $E[Y]$의 함수와 독립변수 $X$와의 선형관계를 모델링한 회귀 모델(regression model)입니다.
일반화 선형 모형의 경우, 반응변수의 분포는 정규분포(Normal distribution)뿐만 아니라 이항 분포(Binomial Distribution), 포아송 분포 등도 사용 가능합니다.
$$ \begin{align*}
g(E[Y]) = X\beta
\end{align*} $$
일반화 선형 모형(GLM)의 구성 요소는 다음 3가지가 존재합니다.
- 확률 요소(Random Component): $y = (y_1, y_2, \cdots, y_n)^T$
- 반응 변수 $y$의 확률분포는 지수족(Exponential Family)에 속하는 분포이어야 합니다.
- 선형 예측자(Link Predictor): $X\beta$
- 선형 예측자는 design Matrix $X$와 Parameter $\beta$의 선형 결합입니다.
- $X \in R^{n \times p}$, $\beta = (\beta_1, \beta_2, \cdots, \beta_p)^T$
- 연결 함수(Link Function) : $g(\cdot)$
- $g(\cdot)$는 선형 예측자 $X\beta$와 반응 변수의 기댓값 $E[Y]$을 연결해주는 함수입니다.
- 연결 함수의 종류에는 항등함수(Identity function), 로짓/시그모이드 함수(Logit/Sigmoid function) 그리고 로그 함수(log function)가 있습니다.
3. Linear Models For Count Time Series
주 내용인 본 section 3에서는 count time series를 일반화 선형 모형(GLM)으로 적합하는 방법에 대해 설명하고자 합니다.
3.1 Poisson Regression Models For Count Time Series
반응변수 $\{Y_t\}$는 count time series이며 서로 상관되어있기(correlated) 때문에 이전 관측치 $F_{t-1} = \{Y_{t-1}, Y_{t-2}, \cdots, \lambda_0\}$가 주어졌을 때의 조건부 분포 $Y_t|F_{t-1}$을 다음과 같이 포아송 자기회귀이동평균(Autoregressive Moving-average : ARMA(1,1)) 모형으로 적합합니다.
$$ \begin{align}
Y_t|F_{t-1} \sim Poisson(\lambda_t) \nonumber
\\
\lambda_t = d + a_1 \lambda_{t-1} + b_1Y_{t-1}, t \geq 1 \tag{1}
\end{align} $$
- $E[Y_t|F_{t-1}] = Var[Y_t|F_{t-1}]=\lambda_t$
- Generalized Linear Model for Count Time Series
- $g(E[Y_t|F_{t-1}]) = g(\lambda_t) = d + a_1 \lambda_{t-1} + b_1Y_{t-1}$
- Link function $g(\cdot) = \text{Identity Function}$
조건부 기댓값에 대한 함수는 항등 함수를 사용했으며 조건부 기댓값 $\lambda_t$는 0보다 커야하므로 $d, \{a_1, b_1\} > 0$의 제약조건이 필요합니다. 이제 식 (1)을 이용하여 $Y_t$의 주변 분포를 구하고자 합니다.
$$ \begin{align}
Y_t &= \lambda_t + (Y_t - \lambda_t) = \lambda_t + \epsilon_t \nonumber
\\ &= d + (a_1 + b_1)Y_{t-1} + \epsilon_t-a_1\epsilon_{t-1} \nonumber
\\ &= d + (a_1 + b_1)(d+(a_1 + b_1)Y_{t-2} + \epsilon_{t-1} - a_1 \epsilon_{t-2}) + \epsilon_t - a_1 \epsilon_{t-1} \nonumber
\\ &= \cdots \nonumber
\\ &= \frac{d}{1-(a_1 + b_1)} + \sum^\infty_{i=0} (a_1 + b_1)^i\epsilon_{t-i} - a_1 \sum^\infty_{j=0} (a_1 + b_1)^j \epsilon_{t-j-1} \tag{2}
\end{align} $$
$Y_t$의 모형은 자기회귀이동평균(ARMA(1,1)) 모형임을 알 수 있으며 정상성(stationary)을 보장하기 위해서 $0<a_1 +b_1<1$의 제약조건이 필요합니다. $\epsilon_t$의 경우 평균, 공분산이 모두 시간 $t$에 의존하지 않기 때문에 White Noise(WN) Process를 따르는 것을 알 수 있습니다.
- $E[\epsilon_t] = E[y_t-\lambda_t] = E[E[y_t-\lambda_t|F_{t-1}]] = 0$
- $Var[\epsilon_t] = Var[E[\epsilon_t|F_{t-1}]] + E[Var[\epsilon_t|F_{t-1}]] = E[\lambda_t] = E[Y_t]$
- $Cov(\epsilon_t, \epsilon_{t+h}) = E[\epsilon_t \epsilon_{t+h}] = E[\epsilon_t E[\epsilon_{t+h} | F_{t+h-1}]] = 0$
식 (2)를 이용하여 $Y_t$의 평균 및 공분산, 상관계수를 구하면 다음과 같습니다.
- $E[Y_t] = \dfrac{d}{1-(a_1 + b_1)} = \mu$
- $Cov(Y_t, Y_{t+h}) = \begin{cases}
\dfrac{(1-(a_1 + b_1)^2 + b_1^2) \mu}{1-(a_1 + b_1)^2} &\text{if } h=0 \\
\dfrac{b_1(1-a_1(a_1+b_1))(a_1+b_1)^{h-1}\mu}{1-(a_1 + b_1)^2} &\text{if } h \geq 1
\end{cases} $
- $b_1 = 0$이면 $E[Y_t] = Var[Y_t]$인 반면 $b_1 > 0$에 대해서는 $Var[Y_t] > E[Y_t]$입니다.
즉, $b_1 > 0$인 경우 과대산포가 존재하며 $Y_t$의 주변 분포는 포아송 분포를 따르지 않음을 알 수 있습니다
- $b_1 = 0$이면 $E[Y_t] = Var[Y_t]$인 반면 $b_1 > 0$에 대해서는 $Var[Y_t] > E[Y_t]$입니다.
- $Corr(Y_t, Y_{t+h}) = \dfrac{b_1(1-a_1(a_1 + b_1))(a_1 + b_1)^{h-1}}{(1-(a_1 + b_1)^2)}$
- 제약조건 $\{a_1 \geq 0, b_1 \geq 0, 0 < a_1 + b_1 < 1\}$이 존재하기 때문에 항상 상관계수 $Corr(Y_t, Y_{t+h})> 0$입니다. 즉, 오직 $Y_t$끼리 양의 상관관계를 가졌을 때만 연결 함수 $g(\cdot)$를 항등함수로 사용가능합니다. 만약, 음의 상관관계를 가진 $Y_t$를 고려할 경우 연결 함수 $g(\cdot)$는 로그 함수를 사용하면 됩니다.
3.2 Negative Binomial Models For Count Time Series
$b_1>0$인 경우 과대산포가 존재하는 것을 고려하기 위해 포아송 감마 혼합 모델을 사용합니다. 이전 관측치 $F_{t-1} = \{Y_{t-1}, Y_{t-2}, \cdots, \lambda_0\}$가 주어졌을 때의 조건부 분포 $Y_t|F_{t-1}$을 다음과 같이 음이항 자기회귀이동평균(Autoregressive Moving-average : ARMA(1,1)) 모형으로 적합합니다.
\begin{align}
Y_t|F_{t-1} \sim NegBin(\lambda_t, \nu) \nonumber\\ \lambda_t = d + a_1 \lambda_{t-1} + b_1Y_{t-1}, t \geq 1 \tag{3}
\end{align}
$Y_t$의 조건부 분포의 평균 및 분산은 각각 $E[Y_t|F_{t-1}] = \lambda_t$와 $Var[Y_t|F_{t-1}] = \lambda_t + \lambda_t^2/\nu$ 같으며 $\lambda_t$에 과대산포를 고려한 식 $\lambda^2_t / \nu$이 추가된 것을 확인할 수 있습니다.
식 (3)을 이용해 $Y_t$의 주변 분포를 구하면 다음과 같습니다.
\begin{align}
Y_t &= d + (a_1 + b_1)Y_{t-1} + \epsilon_t-a_1\epsilon_{t-1} \nonumber
\\
&=\dfrac{d}{1-(a_1 + b_1)} + \sum^\infty_{i=0} (a_1 + b_1)^i\epsilon_{t-i} - a_1 \sum^\infty_{j=0} (a_1 + b_1)^j \epsilon_{t-j-1} \tag{4}
\end{align}
$\epsilon_t$의 평균, 공분산은 다음과 같으며 포아송과는 다르게 공분산에 식 $E[\lambda_t^2] / \nu$이 존재합니다.
- $E[\epsilon_t] = 0, \, Cov[\epsilon_t, \epsilon_{t+h}]= 0$
- $ Var[\epsilon_t] = Var[E[\epsilon_t|F_{t-1}]] + E[Var[\epsilon_t|F_{t-1}]] = E[\lambda_t + \dfrac{\lambda_t^2}{\nu}] = E[Y_t] + \dfrac{E[\lambda_t^2]}{\nu}$
식 (4)를 이용하여 $Y_t$의 평균 및 공분산, 상관계수를 구하면 다음과 같으며 평균과 상관계수는 $Y_t|F_{t-1}$가 포아송 분포를 따를 때와 같은 반면 공분산의 경우 더 큰 값을 가지는 것을 확인할 수 있습니다. 다만 $\nu \to \infty$($1/\nu \to 0$)라면, 음이항 분포는 포아송 분포로 수렴합니다.
- $E[Y_t] = \dfrac{d}{1-(a_1 + b_1)} = \mu$
- $Cov(Y_t, Y_{t+h}) = \begin{cases}
\dfrac{(1-(a_1 + b_1)^2 + b_1^2)}{1-(a_1 + b_1)^2 - \frac{b_1^2}{\nu}}(\mu + \dfrac{\mu^2}{\nu}) &\text{if } h=0 \\
\dfrac{b_1(1-a_1(a_1+b_1))(a_1+b_1)^{h-1}}{1-(a_1 + b_1)^2-\frac{b_1^2}{\nu}}(\mu + \dfrac{\mu^2}{\nu}) &\text{if } h \geq 1
\end{cases} $ - $Corr(Y_t, Y_{t+h}) = \dfrac{b_1(1-a_1(a_1 + b_1))(a_1 + b_1)^{h-1}}{(1-(a_1 + b_1)^2)}$
4. Model Parameter Estimation
Section 4에서는 로그 우도 가능도 함수를 사용해 모수를 추정하는 방법을 소개하고자 합니다. 지금까지는 ARMA(1,1)에 대해 고려하였다면 모수 추정 부분에서는 더 일반화된 모형 ARMA(p,q)를 고려하고자 합니다.
$$\lambda_t = d + \sum^q_{i=1} a_i\lambda_{t-i} + \sum^p_{j=1}b_jY_{t-j}$$
4.1 Model Parameter Estimation for Linear Poisson Model
먼저 $Y_t$의 조건부 분포가 포아송 분포을 따르는 경우에 대해 로그 가능도 함수는 다음과 같습니다.
$$Y_t|F_{t-1} \sim Poisson(\lambda_t), \, \lambda_t = d + \sum^q_{i=1} a_i\lambda_{t-i} + \sum^p_{j=1}b_jY_{t-j}$$
$$l(\theta) = \sum^N_{t=1}(-\lambda_t(\theta) + y_t log (\lambda_t(\theta))-log(y_t!)), \, \theta = (d, a_1, \cdots, a_q, b_1, \cdots, b_p)$$
$\theta$는 regression parameter이며 조건부 기댓값 $\lambda_t$는 $\theta$의 의존하기 때문에 시간 $t$에 대한 평균 함수로 정의합니다. 만약, $E[Y_t] = Var[Y_t]$인 경우, 즉, $Y_t$가 포아송 분포를 따르는 경우 $\theta$의 최대가능도추정량(Maximum Likelihood Estimator: MLE) $\hat{\theta}$은 로그 가능도 함수를 최대화하는 $\theta$ 값입니다.
$$\hat{\theta} = argmax_{\theta \in \Theta}l(\theta), \, \Theta = \{d>0, a_i \geq 0, b_i \geq 0, \sum_i a_i + \sum_j b_j < 1\}$$
4.2 Model Parameter Estimation for Linear NB Model
$Y_t$의 조건부 분포가 음이항 분포을 따르는 경우에 대해 로그 가능도 함수는 다음과 같습니다.
$$Y_t|F_{t-1} \sim NegBin(\lambda_t), \, \lambda_t = d + \sum^q_{i=1} a_i\lambda_{t-i} + \sum^p_{j=1}b_jY_{t-j}$$
$$l(\theta;\nu) = \sum^N_{t=1} [log(\dfrac{\Gamma(y_t +\nu)}{\Gamma(y_t+1)\Gamma(\nu)})+\nu log(\dfrac{\nu}{\nu + \lambda_t(\theta)}) + y_t log(\dfrac{\lambda_t(\theta)}{\nu + \lambda_t(\theta)})], \theta = (d, a_1, \cdots, a_q, b_1, \cdots, b_p)$$
추정해야 할 파라미터는 regression parameter $\theta$ 뿐만 아니라 dispersion parameter $\nu$도 존재합니다. $\theta$가 $\nu$에 의존하지 않기 때문에 기존의 최대 우도 가능도 방법을 사용하지 않고 Quasi conditional maximum likelihood 방법을 사용하며 크게 2단계로 이루어집니다.
첫번째 단계, regression parameter $\theta$를 추정하기 위해 포아송 분포 기반 quasi maximum likelihood를 사용합니다. 제약 조건 하에서 conditional quasi log likelihood function은 다음과 같으며 $l(\theta)$를 최대화하는 $\hat{\theta}$는 Quasi maximum likelihood estimator(QMLE) 입니다.
$$l(\theta) = \sum^n_{t=1} log(p_t(y_t;\theta)) = \sum^n_{t=1} (y_t log(\lambda_t(\theta)) - \lambda_t(\theta)), \, \, \hat{\theta} = argmax_{\theta \in \Theta}l(\theta) $$
$$p_t(y_t;\theta) = P(Y_t=y|F_{t-1}) = \dfrac{\lambda_t^y exp(-\lambda_t)}{y!}, \, t=0,1,2,\cdots$$
두번째 단계, dispersion parameter $\hat{\nu}$은 독립적으로 추정됩니다. QMLE $\hat{\theta}$를 이용하여 조건부 기댓값 $\hat{\lambda} = \lambda_t(\hat{\theta})$을 계산합니다. Christou and Fokianos(2014)에 따르면, 값은 피어슨 카이제곱(Pearson's $\chi^2$) 통계량을 기반으로 된 식 (5)를 만족하는 해(solution)를 $\hat{\nu}$ 값으로 정의합니다.
\begin{align}
N-(p+q+1) = \sum^N_{i=1} \dfrac{(Y_t - \hat{\lambda_t})^2}{\hat{\lambda_t}(1+\frac{\hat{\lambda_t}}{\nu})} \tag{5}
\end{align}
$$\hat{\nu} = (\dfrac{1}{N}\sum^N_{t=1} \dfrac{[(Y_t-\hat{\lambda_t})^2 - \hat{\lambda_t]}}{\hat{\lambda_t}^2})^{-1}$$
5. Experiment
R에서 제공하는 Campy Dataset은 캐나다에서 1990년 1웗루터 2000년 10월까지 한달을 단위로 campylobacterosis 질병에 걸린 횟수에 대한 자료입니다. 일반화 선형 모형(GLM)에 대해서 모형화는 식 (6)과 같습니다.
\begin{align}
\lambda_t = d + a_{13} \lambda_{t-13} + b_1 Y_{t-1} \tag{6}
\end{align}
관측치들간의 상관성을 고려하기 위해 일반화 선형 모형에서 이전 관측치 $Y_{t-1}$에 대해 고려하였고 Figure 1을 참조하면 일년마다의 비슷한 패턴이 어느 정도 보여서 조건부 기댓값에 대해서는 $t$ 시점으로부터 $13$개월 이전 시점 $\lambda_{t-13}$에 대해 고려하였습니다. R package tscount에서 제공하는 함수 tsglm을 사용해 포아송 조건부 분포와 음이항 조건부 분포로 적합한 결과는 다음과 같습니다.
install.pacakges("tscount")
library(tscount)
## campy
## > Time Series:
## > Start = c(1990, 1)
## > End = c(2000, 10)
## > Frequency = 13
## [1] 2 3 4 1 6 9 12 ... [139] 16 9
########## Model Fitting ##########
campyfit_pois <- tsglm(campy, model=list(past_obs=1, past_mean=13), distr="poisson")
campyfit_nbin <- tsglm(campy, model=list(past_obs=1, past_mean=13), distr="nbinom")
########## Result of Poisson Linear Model ##########
summary(campyfit_pois)
[요약통계량]
> Call:
> tsglm(ts = campy, model = list(past_obs = 1, past_mean = 13),
xreg = NULL, distr = "poisson")
> Coefficients:
Estimate Std.Error CI(lower) CI(upper)
(Intercept) 2.296 0.6685 0.9855 3.606
beta_1 0.572 0.0531 0.4680 0.676
alpha_13 0.217 0.0775 0.0648 0.369
Standard errors and confidence intervals (level = 95 %) obtained
by normal approximation.
> Link function: identity
> Distribution family: poisson
> Number of coefficients: 3
> Log-likelihood: -435.4042
> AIC: 876.8084
> BIC: 885.6334
> QIC: 878.0422
"Poisson" | Estimate | Std.Error | CI(lower) | CI(upper) |
(Intercept) | 2.296 | 0.6685 | 0.9855 | 3.606 |
beta_1 | 0.572 | 0.0531 | 0.4680 | 0.676 |
alpha_13 | 0.217 | 0.0775 | 0.0648 | 0.369 |
########## Result of NegBin Linear Model ##########
summary(campyfit_nbin)
[요약통계량]
> Call:
> tsglm(ts = campy, model = list(past_obs = 1, past_mean = 13),
xreg = NULL, distr = "nbinom")
> Coefficients:
> Estimate Std.Error CI(lower) CI(upper)
> (Intercept) 2.296 1.0694 0.1998 4.392
> beta_1 0.572 0.0922 0.3916 0.753
> alpha_13 0.217 0.1265 -0.0312 0.465
> sigmasq 0.112 NA NA NA
> Standard errors and confidence intervals (level = 95 %) obtained
by normal approximation.
> Link function: identity
> Distribution family: nbinom (with overdispersion coefficient 'sigmasq')
> Number of coefficients: 4
> Log-likelihood: -406.0332
> AIC: 820.0665
> BIC: 831.833
> QIC: 890.002
"Negative Binomial" | Estimate | Std.Error | CI(lower) | CI(upper) |
(Intercept) | 2.296 | 1.0694 | 0.1998 | 4.392 |
beta_1 | 0.572 | 0.0922 | 0.3916 | 0.753 |
alpha_13 | 0.217 | 0.1265 | -0.0312 | 0.465 |
sigmasq | 0.112 | NA | NA | NA |
적합 결과를 확인해 보면, 추정된 회귀 계수 값은 같지만 분산이 $Y_t$의 조건부 분포가 음이항 분포인 경우 더 큰 값을 가지는 것을 확인할 수 있습니다. 또한 추정된 과대산포(sigmasq) 값은 $0.112$로 상대적으로 작은 값을 가집니다. Figure 2를 통해 두 모델의 $Y_t$의 상관계수($Corr(Y_t, Y_{t+h})$)가 같음을 확인할 수 있으며 계절성이나 상관성이 보이지 않는 것을 확인할 수 있습니다.
########## visualization ##########
plot(campyfit_pois)
plot(campyfit_nbin)
par(mfrow=c(2,1))
acf(residuals(campyfit_pois), main="ACF of Poisson response residuals")
acf(residuals(campyfit_nbin), main="ACF of NegBin response residuals")
두 개의 모델에 대한 성능 평가 방법은 아래 표와 같으며 결과를 확인해 보면 음이항 분포가 모든 성능 평가 지표에서 더 작은 값을 보이므로 Campy Dataset을 적합할 때는 음이항 조건부 분포를 고려하는 것이 더 타당하다는 사실을 알 수 있습니다.
Scoring Rule | Abbreviation | Definition |
logarithmic score | logarithmic | $-log(p_t(y_t)$ |
quadratic score | quadratic | $-2p_t(y_t) + ||p_t||^2$ |
spherical score | spherical | $-p_t(y_t) / ||p_t||^2$ |
ranked probability score | rankprob | $\sum^\infty_{y=0}(P_t(y) - 1(y_t \leq y))^2$ |
Dawid-Sebastiani score | dawseb | $(y_t - \lambda_t)^2/v_t^2 + 2log(v_t)$ |
normalized squared error score | normsq | $(y_t - \lambda_t)^2/v_t^2$ |
squared error score & | sqerror | $(y_t - \lambda_t)^2)$ |
rbind(Poisson=scoring(campyfit_pois), NegBin=scoring(campyfit_nbin))
## > logarithmic quadratic spherical rankprob dawseb normsq sqerror
## > Poisson 3.110030 -0.06888556 -0.2618928 2.687020 4.705391 2.3461116 30.92966
## > NegBin 2.900237 -0.07054600 -0.2636117 2.649399 4.136334 0.9785718 30.92966
logarithmic | quadratic | spherical | rankprob | dawseb | normsq | sqerror | |
Poisson | 3.110030 | -0.06888556 | -0.2618928 | 2.687020 | 4.705391 | 2.3461116 | 30.92966 |
NegBin | 2.900237 | -0.07054600 | -0.2636117 | 2.649399 | 4.136334 | 0.9785718 | 30.92966 |
Reference
[1].Generalized linear models for count time series: Bosowski, Nicholas and Ingle, Vinay and Manolakis, Dimitris (2017)
[2]. Count time series models: Fokianos, Konstantinos (2012)
[3]. tscount: An R package for analysis of count time series following generalized linear models: Liboschik, Tobias and Fokianos, Konstantinos and Fried, Roland (2017)
'Statistics' 카테고리의 다른 글
Variational Inference(변분법) (0) | 2024.06.24 |
---|---|
Peak Over Threshold(POT)와 Epsilon Threshold (0) | 2024.02.11 |
Oracle P-values and variable screening (0) | 2022.11.27 |