Distribució t multivariantTipus | distribució conjunta, Distribució el·líptica i matrix t-distribution (en)  |
---|
Notació |  |
---|
Paràmetres |
matriu definida positiva graus de llibertat |
---|
Suport |  |
---|
fdp | ![{\displaystyle {\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}({\text{det}}{\boldsymbol {\Sigma }})^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {x} }-{\boldsymbol {\mu }})^{'}{\boldsymbol {\Sigma }}^{-1}({\mathbf {x} }-{\boldsymbol {\mu }})\right]^{-(\nu +p)/2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d33f408b4705f151ed0aa88eb7e03467c68f84da) |
---|
Esperança matemàtica | , si  |
---|
Mediana |  |
---|
Moda |  |
---|
Variància | , si  |
---|
Coeficient de simetria | 0 |
---|
En Teoria de la probabilitat i Estadística, la distribució
mutivariable o multivariant és una extensió vectorial de la distribució
de Student. Aquesta distribució és una alternativa a la distribució normal multivariable quan apareixen dades atípiques (outliers) o cues pesades, com passa sovint en l'anàlisi de dades financeres. D'altra banda, també és molt utilitzada en estadística bayesiana multivariant com a distribució a priori.[1]
Escriurem tots els vectors en columna i per una matriu o vector
, escriurem
per designar la seva transposada.
Siguin
variables aleatòries independents , totes amb distribució normal estàndard
, i sigui
una variable aleatòria amb distribució hki quadrat amb
graus de llibertat,
, independent de
. Definim el vector
Es diu que
té té una distribució
multivariable amb
graus de llibertat.[2] Noteu que
tenen distribució
de Student amb
graus de llibertat,
, però no són independents ja que totes tenen el factor
.
En notació vectorial, si escrivim
, que és un vector normal multivariable
, on
és la matriu identitat de dimensió
, tenim
Notació: S'escriu
.
La funció de densitat de
és [2]
Aquest densitat es troba exactament igual que la de la funció de densitat de la distribució
de Student, però fent el canvi de variables
i calculant la densitat marginal de
.
- Per a
, l'expressió (2) es redueix a la funció de densitat de la distribució
de Student amb
graus de llibertat.
- Estudiem el cas
. Tenim
Per construcció, les densitats marginals de
i
són 
Per tant,
que és coherent amb el fet que
i
no són independents. Però també implica que si
i
són dues variables aleatòries independents ambdues amb distribució
, llavors el vector
no té una distribució
bivariable, en contrast amb allò que passa amb les variables normals independents. Finalment, noteu que si
, llavors
i
tindran moment de segon ordre i
i
amb la qual cosa
i
estan incorrelacionades
Sigui
, on
és una matriu definida positiva (en particular, simètrica i amb determinant diferent de 0) ,
, i
, independent de
. Aleshores el vector aleatori
es diu que té una distribució
multivariable amb
graus de llibertat, amb paràmetres
i
(també es diu que
és el vector de posició i
el paràmetre d'escala ), i s'escriu
. La funció de densitat és [2]
|
on
és el determinant de la matriu
. Quan
, llavors s'obté una distribució
amb tres paràmetres.
De les propietats de les distribucions normals multivariables
on
és l'arrel quadrada de la matriu
,[3] tindrem que
D'on es dedueix l'expressió de la densitat (4) a partir de (2) mitjançant la formula de canvi de variables per a vectors aleatoris.
Es important remarcar que aquesta distribució pertany a la família de les distribucions amb simetria el·líptica [4]
La distribució
multivariable comparteix amb la distribució normal multivariable diverses propietats importants.
Sigui
. Aleshores qualsevol subvector també té una distribució
multivariable. Més concretament, per
i (per simplificar les notacions) prenem
. Llavors
, on
i
és la submatriu de
obtinguda eliminant les files
i les columnes
. Aquesta propietat es dedueix de la representació (3) del vector
.
Sigui
,
una matriu
definida positiva (en particular, simètrica) i
. Aleshores
Aquesta propietat es dedueix de la representació (3) i de les propietats dels vectors normals multivariables.
Combinacions lineals de les components
[modifica]
Sigui
. Considerem una combinació lineal de les seves components
on
. Aleshores
on aquesta última és una distribució
de Student amb 3 paràmetres (graus de llibertat, paràmetre de posició i quadrat del paràmetre d'escala) .
Aquesta propietat també es demostra a partir de les propietats de la distribució normal multivariable.
Sigui
i separem-lo en dues parts
i
de dimensions
i
respectivament, amb
,
Partim de la mateixa manera
,
i la matriu
de la forma
Aleshores la distribució de
condicionada a
és una distribució
multivariable:
on
és el quadrat de la distància de Mahalanobis de
a
amb matriu d'escala
.
és el complement de Schur de la matriu
en
.
és la regressió lineal de
sobre
.
- Per a la demostració vegeu.[5]
Convergència a la distribució normal multivariable
[modifica]
Quan
, la distribució
s'aproxima a una distribució normal multivariable
. Concretament, si
(suposem
un nombre natural), i
llavors
Aquesta propietat es demostra utilitzant la tècnica de Cramer-Wold, juntament amb la propietat que hem vist sobre les combinacions lineals de les components d'un vector amb distribució
multivariable i la convergència de la distribució
de Student a la distribució normal.
Sigui
. Les següents dues propietats es demostren a partir de la representació (3).
Esperança
Si
, llavors el vector
té esperança i
Matriu de variàncies-covariàncies.
Si
, aleshores la matriu de variàncies-covariàncies del vector
és:
Moments d'ordre superior. [4]
Ens restringirem al cas que
i
. Sigui
i
nombres naturals tals que
. Aleshores
i si
són parells, aleshores
Si algun dels
és senar, aleshores l'esperança anterior és 0.
Aquesta propietat es demostra a partir de la representació (1), de la independència de
i
, i les fórmules per als moments d'una distribució
i dels d'una distribució khi quadrat.
La funció característica no té una expressió senzilla. Vegeu [1] o.[6][7]
La definició constructiva d'una distribució t multivariant serveix simultàniament com a algorisme de mostreig:
- Generar
i
, independentment.
- Calcular
.
Aquesta formulació dona lloc a la representació jeràrquica d'una distribució t multivariant com una mixtura d'escala de normals: Si
on
indica una distribució gamma amb densitat proporcional a
, i
condicionalment segueix
.
- ↑ 1,0 1,1 Kotz, Samuel; Nadarajah, Saralees. Multivariate T-Distributions and Their Applications. Cambridge: Cambridge University Press, 2004, p. 36. DOI 10.1017/cbo9780511550683. ISBN 978-0-521-82654-9.
- ↑ 2,0 2,1 2,2 Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J: Wiley-Interscience, 2003, p. 55. ISBN 978-0-471-36091-9.
- ↑ Seber, G.A.F.. A Matrix Handbook for Statisticians. Wiley, 2008, p. 221, ítem 10.2.
- ↑ 4,0 4,1 Fang, Kaitai; Kotz, Samuel; Ng, Kai-Wang. Symmetric multivariate and related distributions. Reissued 2018. Milton: CRC Press, 2018, p. 32-33, 85-88. ISBN 978-1-315-89794-3.
- ↑ Ding, Peng «On the Conditional Distribution of the Multivariate t Distribution». The American Statistician, 70, 3, 2016, pàg. 293–295. ISSN: 0003-1305.
- ↑ Sutradhar, Brajendra C. «On the Characteristic Function of Multivariate Student t-Distribution». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 14, 4, 1986, pàg. 329–337. DOI: 10.2307/3315191. ISSN: 0319-5724.
- ↑ «Addendum to Dagum and Sutradhar». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 16, 3, 1988, pàg. 323–323. DOI: 10.2307/3314742. ISSN: 0319-5724.