Distribució t multivariant

Distribució t multivariant
Tipus	distribució conjunta, Distribució el·líptica i matrix t-distribution (en)
Notació
Paràmetres	; matriu definida positiva ; graus de llibertat
Suport
fdp
Esperança matemàtica	, si
Mediana
Moda
Variància	, si
Coeficient de simetria	0

En Teoria de la probabilitat i Estadística, la distribució $t$ mutivariable o multivariant és una extensió vectorial de la distribució $t$ de Student. Aquesta distribució és una alternativa a la distribució normal multivariable quan apareixen dades atípiques (outliers) o cues pesades, com passa sovint en l'anàlisi de dades financeres. D'altra banda, també és molt utilitzada en estadística bayesiana multivariant com a distribució a priori.^[1]

Definició

Escriurem tots els vectors en columna i per una matriu o vector ${\boldsymbol {A}}$ , escriurem ${\boldsymbol {A}}'$ per designar la seva transposada.

El cas més senzill

Siguin $Z_{1},\dots ,Z_{p}$ variables aleatòries independents , totes amb distribució normal estàndard ${\mathcal {N}}(0,1)$ , i sigui $Q$ una variable aleatòria amb distribució hki quadrat amb $\nu >0$ graus de llibertat, $Q\sim \chi _{\nu }^{2}$ , independent de $Z_{1},\dots ,Z_{p}$ . Definim el vector

${\boldsymbol {T}}=(T_{1},\dots ,T_{p})^{\prime }={\frac {1}{\sqrt {Q/\nu }}}\,(Z_{1},\dots ,Z_{p})'.$ Es diu que ${\boldsymbol {T}}$ té té una distribució $t$ multivariable amb $\nu$ graus de llibertat.^[2] Noteu que $T_{j}={\frac {Z_{j}}{\sqrt {Q/\nu }}},\ j=1,\dots ,p,$ tenen distribució $t$ de Student amb $\nu$ graus de llibertat, $T_{j}\sim t(\nu )$ , però no són independents ja que totes tenen el factor $Q$ .

En notació vectorial, si escrivim ${\boldsymbol {Z}}=(Z_{1},\dots ,Z_{p})^{\prime }$ , que és un vector normal multivariable ${\mathcal {N}}_{p}({\boldsymbol {0}},{\boldsymbol {I}}_{p})$ , on ${\boldsymbol {I}}_{p}$ és la matriu identitat de dimensió $p$ , tenim ${\boldsymbol {T}}={\frac {1}{\sqrt {Q/\nu }}}\,{\boldsymbol {Z}}.\qquad \qquad (1)$ Notació: S'escriu ${\boldsymbol {T}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {0}},{\boldsymbol {I}}_{p})$ . La funció de densitat de ${\boldsymbol {T}}$ és ^[2]

$f_{\boldsymbol {T}}(x_{1},\dots ,x_{p})={\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}}}\left(1+{\frac {1}{\nu }}\sum _{j=1}^{p}x_{j}^{2}\right)^{-(\nu +p)/2}.\qquad \qquad (2)$

Aquest densitat es troba exactament igual que la de la funció de densitat de la distribució $t$ de Student, però fent el canvi de variables $(Z_{1},\dots ,Z_{p},Q)\longrightarrow (T_{1},\dots ,T_{p},Q)$ i calculant la densitat marginal de $(T_{1},\dots ,T_{p})$ .

Per a

p=1

, l'expressió (2) es redueix a la funció de densitat de la distribució

t

de Student amb

\nu

graus de llibertat.

Estudiem el cas

p=2

. Tenim

f_{T_{1},T_{2}}(x_{1},x_{2})={\frac {\Gamma \left[(\nu +2)/2\right]}{\Gamma (\nu /2)\nu \,\pi }}\left(1+{\frac {1}{\nu }}(x_{1}^{2}+x_{2}^{2})\right)^{-(\nu +2)/2}.

Per construcció, les densitats marginals de

T_{1}

i

T_{2}

són

f_{T_{1}}(x)=f_{T_{2}}(x)={\frac {\Gamma ((\nu +1)/2)}{\Gamma (\nu /2)\,{\sqrt {\pi \nu }}}}{\Big (}1+{\frac {x^{2}}{\nu }}{\Big )}^{-(\nu +1)/2}.

Per tant, $f_{T_{1}}(x_{1})\,f_{T_{2}}(x_{2})\neq f_{T_{1},T_{2}}(x_{1},x_{2}),$ que és coherent amb el fet que $T_{1}$ i $T_{2}$ no són independents. Però també implica que si $S_{1}$ i $S_{2}$ són dues variables aleatòries independents ambdues amb distribució $t_{\nu }$ , llavors el vector $(S_{1},S_{2})$ no té una distribució $t$ bivariable, en contrast amb allò que passa amb les variables normals independents. Finalment, noteu que si $\nu >2$ , llavors $T_{1}$ i $T_{2}$ tindran moment de segon ordre i $E[T_{1}]=E[T_{2}]=0,$ i $E[T_{1}T_{2}]=\nu \,E{\Big [}{\frac {1}{Q}}{\Big ]}E[Z_{1}]\,E[Z_{2}]=0,$ amb la qual cosa $T_{1}$ i $T_{2}$ estan incorrelacionades

Cas general

Sigui ${\boldsymbol {Y}}\sim {\mathcal {N}}_{p}({\boldsymbol {0}},{\boldsymbol {\Sigma }})$ , on ${\boldsymbol {\Sigma }}$ és una matriu definida positiva (en particular, simètrica i amb determinant diferent de 0) , ${\boldsymbol {\mu }}\in \mathbb {R} ^{p}$ , i $Q\sim \chi _{\nu }^{2}$ , independent de ${\boldsymbol {Y}}$ . Aleshores el vector aleatori ${\boldsymbol {X}}={\frac {1}{\sqrt {Q/\nu }}}\,{\boldsymbol {Y}}+{\boldsymbol {\mu }}\qquad \qquad (3)$ es diu que té una distribució $t$ multivariable amb $\nu$ graus de llibertat, amb paràmetres ${\boldsymbol {\mu }}$ i ${\boldsymbol {\Sigma }}$ (també es diu que ${\boldsymbol {\mu }}$ és el vector de posició i ${\boldsymbol {\Sigma }}$ el paràmetre d'escala ), i s'escriu ${\boldsymbol {X}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . La funció de densitat és ^[2]

$f_{\boldsymbol {X}}({\boldsymbol {x}})={\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}{\sqrt {{\text{det}}\,{\boldsymbol {\Sigma }}}}}}\left[1+{\frac {1}{\nu }}({\mathbf {x} }-{\boldsymbol {\mu }})'{\boldsymbol {\Sigma }}^{-1}({\mathbf {x} }-{\boldsymbol {\mu }})\right]^{-(\nu +p)/2},\qquad \qquad (4)$

on ${\text{det}}\,{\boldsymbol {\Sigma }}$ és el determinant de la matriu ${\boldsymbol {\Sigma }}$ . Quan $p=1$ , llavors s'obté una distribució $t$ amb tres paràmetres.

De les propietats de les distribucions normals multivariables ${\boldsymbol {Y}}={\boldsymbol {\Sigma }}^{1/2}\,{\boldsymbol {Z}},\ {\text{en distribució}},$ on ${\boldsymbol {\Sigma }}^{1/2}$ és l'arrel quadrada de la matriu ${\boldsymbol {\Sigma }}$ ,^[3] tindrem que ${\boldsymbol {X}}={\boldsymbol {\Sigma }}^{1/2}{\boldsymbol {T}}+{\boldsymbol {\mu }},\ {\text{en distribució}}.\qquad \qquad (5)$ D'on es dedueix l'expressió de la densitat (4) a partir de (2) mitjançant la formula de canvi de variables per a vectors aleatoris.

Es important remarcar que aquesta distribució pertany a la família de les distribucions amb simetria el·líptica ^[4]

Propietats

La distribució $t$ multivariable comparteix amb la distribució normal multivariable diverses propietats importants.

Distribucions marginals

Sigui ${\boldsymbol {X}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Aleshores qualsevol subvector també té una distribució $t$ multivariable. Més concretament, per $q=1,\dots ,p-1$ i (per simplificar les notacions) prenem ${\boldsymbol {X}}_{q}=(X_{1},\dots ,X_{q})^{\prime }$ . Llavors ${\boldsymbol {X}}_{q}\sim {\boldsymbol {t}}_{q}(\nu ,{\boldsymbol {\mu }}_{q},{\boldsymbol {\Sigma }}_{qq})$ , on ${\boldsymbol {\mu }}_{q}=(\mu _{1},\dots ,\mu _{q})$ i ${\boldsymbol {\Sigma }}_{qq}$ és la submatriu de ${\boldsymbol {\Sigma }}$ obtinguda eliminant les files $q+1,\dots ,p$ i les columnes $q+1,\dots ,p$ . Aquesta propietat es dedueix de la representació (3) del vector ${\boldsymbol {X}}$ .

Transformacions afins

Sigui ${\boldsymbol {X}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ , ${\boldsymbol {B}}$ una matriu $p\times p$ definida positiva (en particular, simètrica) i ${\boldsymbol {b}}\in \mathbb {R} ^{p}$ . Aleshores ${\boldsymbol {B}}{\boldsymbol {X}}+{\boldsymbol {b}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {B}}{\boldsymbol {\mu }}+{\boldsymbol {b}},{\boldsymbol {B\Sigma B}}).$ Aquesta propietat es dedueix de la representació (3) i de les propietats dels vectors normals multivariables.

Combinacions lineals de les components

Sigui ${\boldsymbol {X}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Considerem una combinació lineal de les seves components $S={\boldsymbol {a}}'{\boldsymbol {X}}=\sum _{j=1}^{p}a_{j}X_{j},$ on ${\boldsymbol {a}}=(a_{1},\dots ,a_{p})'$ . Aleshores $S\sim t(\nu ,{\boldsymbol {a}}'{\boldsymbol {\mu }},{\boldsymbol {a\Sigma }}{\boldsymbol {a}}'),$ on aquesta última és una distribució $t$ de Student amb 3 paràmetres (graus de llibertat, paràmetre de posició i quadrat del paràmetre d'escala) .

Aquesta propietat també es demostra a partir de les propietats de la distribució normal multivariable.

Distribucions condicionades

Sigui ${\boldsymbol {X}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ i separem-lo en dues parts ${\boldsymbol {X}}_{1}$ i ${\boldsymbol {X}}_{2}$ de dimensions $p_{1}$ i $p_{2}$ respectivament, amb $p_{1}+p_{2}=p$ , ${\boldsymbol {X}}={\begin{pmatrix}{\boldsymbol {X}}_{1}\\{\boldsymbol {X}}_{2}\end{pmatrix}}$ Partim de la mateixa manera ${\boldsymbol {\mu }}$ ,

${\boldsymbol {\mu }}={\begin{pmatrix}{\boldsymbol {\mu }}_{1}\\{\boldsymbol {\mu }}_{2}\end{pmatrix}},$

i la matriu ${\boldsymbol {\Sigma }}$ de la forma ${\boldsymbol {\Sigma }}={\begin{pmatrix}{\boldsymbol {\Sigma }}_{11}&{\boldsymbol {\Sigma }}_{12}\\{\boldsymbol {\Sigma }}_{21}&{\boldsymbol {\Sigma }}_{22}\end{pmatrix}}$ Aleshores la distribució de ${\boldsymbol {X}}_{2}$ condicionada a ${\boldsymbol {X}}_{1}$ és una distribució $t$ multivariable: ${\boldsymbol {X}}_{2}\,\vert \,{\boldsymbol {X}}_{1}\sim {\boldsymbol {t}}_{p_{2}}{\Big (}\nu +p_{1},\,{\boldsymbol {\mu }}_{2|1},\,{\frac {\nu +d_{1}}{\nu +p_{1}}}\,{\boldsymbol {\Sigma }}_{22|1}{\Big )},$ on

d_{1}=({\boldsymbol {X}}_{1}-{\boldsymbol {\mu }}_{1})^{\prime }{\boldsymbol {\Sigma }}_{11}^{-1}({\boldsymbol {X}}_{1}-{\boldsymbol {\mu }}_{1})

és el quadrat de la distància de Mahalanobis de

{\boldsymbol {X}}_{1}

a

{\boldsymbol {\mu }}_{1}

amb matriu d'escala

${\boldsymbol {\Sigma }}_{11}$ .

{\boldsymbol {\Sigma }}_{22|1}={\boldsymbol {\Sigma }}_{22}-{\boldsymbol {\Sigma }}_{21}{\boldsymbol {\Sigma }}_{11}^{-1}{\boldsymbol {\Sigma }}_{12}

és el complement de Schur de la matriu

{\boldsymbol {\Sigma }}_{11}

en

{\boldsymbol {\Sigma }}

.

{\boldsymbol {\mu }}_{2|1}={\boldsymbol {\mu }}_{2}+{\boldsymbol {\Sigma }}_{21}{\boldsymbol {\Sigma }}_{11}^{-1}({\boldsymbol {X}}_{1}-{\boldsymbol {\mu }}_{1})

és la regressió lineal de

{\boldsymbol {X}}_{2}

sobre

{\boldsymbol {X}}_{1}

.

Per a la demostració vegeu.^[5]

Convergència a la distribució normal multivariable

Quan $\nu \to \infty$ , la distribució ${\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ s'aproxima a una distribució normal multivariable ${\mathcal {N}}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Concretament, si ${\boldsymbol {X}}_{\nu }\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ (suposem $\nu$ un nombre natural), i ${\boldsymbol {X}}\sim {\mathcal {N}}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ llavors $\lim _{\nu \to \infty }{\boldsymbol {X}}_{\nu }={\boldsymbol {X}},\quad {\text{en distribució}}.$ Aquesta propietat es demostra utilitzant la tècnica de Cramer-Wold, juntament amb la propietat que hem vist sobre les combinacions lineals de les components d'un vector amb distribució $t$ multivariable i la convergència de la distribució $t$ de Student a la distribució normal.

Moments

Sigui ${\boldsymbol {X}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Les següents dues propietats es demostren a partir de la representació (3).

Esperança

Si $\nu >1$ , llavors el vector ${\boldsymbol {X}}$ té esperança i $E[{\boldsymbol {X}}]={\boldsymbol {\mu }}.$

Matriu de variàncies-covariàncies.

Si $\nu >2$ , aleshores la matriu de variàncies-covariàncies del vector ${\boldsymbol {X}}$ és: ${\boldsymbol {V}}({\boldsymbol {X}})={\frac {\nu }{\nu -2}}\,{\boldsymbol {\Sigma }}.$ Moments d'ordre superior. ^[4]

Ens restringirem al cas que ${\boldsymbol {\mu }}={\boldsymbol {0}}$ i ${\boldsymbol {\Sigma }}={\boldsymbol {I}}_{p}$ . Sigui ${\boldsymbol {T}}\sim {\boldsymbol {t}}_{p}(\nu ,{\boldsymbol {0}},{\boldsymbol {I}}_{p})$ i $n_{1}\geq 0,\dots ,n_{p}\geq 0$ nombres naturals tals que $n_{1}+\cdots +n_{p}=n<\nu$ . Aleshores $E{\big [}{\big \vert }T_{1}^{n_{1}}\cdots T_{p}^{n_{p}}{\big |}{\big ]}<\infty$ i si $n_{1},\dots ,n_{p}$ són parells, aleshores $E{\big [}T_{1}^{n_{1}}\cdots T_{p}^{n_{p}}{\big ]}=\nu ^{n/2}{\frac {\Gamma {\big (}{\frac {\nu -n}{2}}{\big )}}{2^{n/2}\Gamma {\big (}{\frac {\nu }{2}}{\big )}}}\prod _{j=1}^{p}{\frac {n_{j}!}{2^{n_{j}/2}\,(n_{j}/2)!}}.$ Si algun dels $n_{1},\dots ,n_{p}$ és senar, aleshores l'esperança anterior és 0.

Aquesta propietat es demostra a partir de la representació (1), de la independència de $Z_{1},\dots ,Z_{p}$ i $Q$ , i les fórmules per als moments d'una distribució ${\mathcal {N}}(0,1)$ i dels d'una distribució khi quadrat.

Funció característica

La funció característica no té una expressió senzilla. Vegeu ^[1] o.^[6]^[7]

Simulació

La definició constructiva d'una distribució t multivariant serveix simultàniament com a algorisme de mostreig:

Generar $u\sim \chi _{\nu }^{2}$ i $\mathbf {y} \sim N(\mathbf {0} ,{\boldsymbol {\Sigma }})$ , independentment.
Calcular $\mathbf {x} \gets {\sqrt {\nu /u}}\mathbf {y} +{\boldsymbol {\mu }}$ .

Mixtura

Aquesta formulació dona lloc a la representació jeràrquica d'una distribució t multivariant com una mixtura d'escala de normals: Si $u\sim \mathrm {Ga} (\nu /2,\nu /2)$ on $\mathrm {Ga} (a,b)$ indica una distribució gamma amb densitat proporcional a $x^{a-1}e^{-bx}$ , i $\mathbf {x} \mid u$ condicionalment segueix $N({\boldsymbol {\mu }},u^{-1}{\boldsymbol {\Sigma }})$ .

Referències

↑ ^1,0 ^1,1 Kotz, Samuel; Nadarajah, Saralees. Multivariate T-Distributions and Their Applications. Cambridge: Cambridge University Press, 2004, p. 36. DOI 10.1017/cbo9780511550683. ISBN 978-0-521-82654-9.
↑ ^2,0 ^2,1 ^2,2 Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J: Wiley-Interscience, 2003, p. 55. ISBN 978-0-471-36091-9.
↑ Seber, G.A.F.. A Matrix Handbook for Statisticians. Wiley, 2008, p. 221, ítem 10.2.
↑ ^4,0 ^4,1 Fang, Kaitai; Kotz, Samuel; Ng, Kai-Wang. Symmetric multivariate and related distributions. Reissued 2018. Milton: CRC Press, 2018, p. 32-33, 85-88. ISBN 978-1-315-89794-3.
↑ Ding, Peng «On the Conditional Distribution of the Multivariate t Distribution». The American Statistician, 70, 3, 2016, pàg. 293–295. ISSN: 0003-1305.
↑ Sutradhar, Brajendra C. «On the Characteristic Function of Multivariate Student t-Distribution». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 14, 4, 1986, pàg. 329–337. DOI: 10.2307/3315191. ISSN: 0319-5724.
↑ «Addendum to Dagum and Sutradhar». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 16, 3, 1988, pàg. 323–323. DOI: 10.2307/3314742. ISSN: 0319-5724.

[:0-1] 1,0 ^1,1 Kotz, Samuel; Nadarajah, Saralees. Multivariate T-Distributions and Their Applications. Cambridge: Cambridge University Press, 2004, p. 36. DOI 10.1017/cbo9780511550683. ISBN 978-0-521-82654-9.

[:1-2] 2,0 ^2,1 ^2,2 Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J: Wiley-Interscience, 2003, p. 55. ISBN 978-0-471-36091-9.

[3] Seber, G.A.F.. A Matrix Handbook for Statisticians. Wiley, 2008, p. 221, ítem 10.2.

[:2-4] 4,0 ^4,1 Fang, Kaitai; Kotz, Samuel; Ng, Kai-Wang. Symmetric multivariate and related distributions. Reissued 2018. Milton: CRC Press, 2018, p. 32-33, 85-88. ISBN 978-1-315-89794-3.

[5] Ding, Peng «On the Conditional Distribution of the Multivariate t Distribution». The American Statistician, 70, 3, 2016, pàg. 293–295. ISSN: 0003-1305.

[6] Sutradhar, Brajendra C. «On the Characteristic Function of Multivariate Student t-Distribution». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 14, 4, 1986, pàg. 329–337. DOI: 10.2307/3315191. ISSN: 0319-5724.

[7] «Addendum to Dagum and Sutradhar». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 16, 3, 1988, pàg. 323–323. DOI: 10.2307/3314742. ISSN: 0319-5724.

[1]

[2]

[3]

[4]

[5]

[6]

[7]