Distribució t multivariantTipus | distribució conjunta, Distribució el·líptica i matrix t-distribution (en) |
---|
Notació | |
---|
Paràmetres |
matriu definida positiva graus de llibertat |
---|
Suport | |
---|
fdp | |
---|
Esperança matemàtica | , si |
---|
Mediana | |
---|
Moda | |
---|
Variància | , si |
---|
Coeficient de simetria | 0 |
---|
En Teoria de la probabilitat i Estadística, la distribució mutivariable o multivariant és una extensió vectorial de la distribució de Student. Aquesta distribució és una alternativa a la distribució normal multivariable quan apareixen dades atípiques (outliers) o cues pesades, com passa sovint en l'anàlisi de dades financeres. D'altra banda, també és molt utilitzada en estadística bayesiana multivariant com a distribució a priori.[1]
Escriurem tots els vectors en columna i per una matriu o vector , escriurem per designar la seva transposada.
Siguin variables aleatòries independents , totes amb distribució normal estàndard , i sigui una variable aleatòria amb distribució hki quadrat amb graus de llibertat, , independent de . Definim el vector
Es diu que té té una distribució multivariable amb graus de llibertat.[2] Noteu que tenen distribució de Student amb graus de llibertat, , però no són independents ja que totes tenen el factor .
En notació vectorial, si escrivim , que és un vector normal multivariable , on és la matriu identitat de dimensió , tenim Notació: S'escriu .
La funció de densitat de és [2]
Aquest densitat es troba exactament igual que la de la funció de densitat de la distribució de Student, però fent el canvi de variables i calculant la densitat marginal de .
- Per a , l'expressió (2) es redueix a la funció de densitat de la distribució de Student amb graus de llibertat.
- Estudiem el cas . Tenim Per construcció, les densitats marginals de i són
Per tant, que és coherent amb el fet que i no són independents. Però també implica que si i són dues variables aleatòries independents ambdues amb distribució , llavors el vector no té una distribució bivariable, en contrast amb allò que passa amb les variables normals independents. Finalment, noteu que si , llavors i tindran moment de segon ordre i
i
amb la qual cosa i estan incorrelacionades
Sigui , on és una matriu definida positiva (en particular, simètrica i amb determinant diferent de 0) , , i , independent de . Aleshores el vector aleatories diu que té una distribució multivariable amb graus de llibertat, amb paràmetres i (també es diu que és el vector de posició i el paràmetre d'escala ), i s'escriu . La funció de densitat és [2]
|
on és el determinant de la matriu . Quan , llavors s'obté una distribució amb tres paràmetres.
De les propietats de les distribucions normals multivariables on és l'arrel quadrada de la matriu ,[3] tindrem que D'on es dedueix l'expressió de la densitat (4) a partir de (2) mitjançant la formula de canvi de variables per a vectors aleatoris.
Es important remarcar que aquesta distribució pertany a la família de les distribucions amb simetria el·líptica [4]
La distribució multivariable comparteix amb la distribució normal multivariable diverses propietats importants.
Sigui . Aleshores qualsevol subvector també té una distribució multivariable. Més concretament, per i (per simplificar les notacions) prenem . Llavors , on i és la submatriu de obtinguda eliminant les files i les columnes . Aquesta propietat es dedueix de la representació (3) del vector .
Sigui , una matriu definida positiva (en particular, simètrica) i . Aleshores Aquesta propietat es dedueix de la representació (3) i de les propietats dels vectors normals multivariables.
Combinacions lineals de les components
[modifica]
Sigui . Considerem una combinació lineal de les seves components on . Aleshoreson aquesta última és una distribució de Student amb 3 paràmetres (graus de llibertat, paràmetre de posició i quadrat del paràmetre d'escala) .
Aquesta propietat també es demostra a partir de les propietats de la distribució normal multivariable.
Sigui i separem-lo en dues parts i de dimensions i respectivament, amb , Partim de la mateixa manera ,
i la matriu de la forma Aleshores la distribució de condicionada a és una distribució multivariable: on
- és el quadrat de la distància de Mahalanobis de a amb matriu d'escala
.
- és el complement de Schur de la matriu en .
- és la regressió lineal de sobre .
- Per a la demostració vegeu.[5]
Convergència a la distribució normal multivariable
[modifica]
Quan , la distribució s'aproxima a una distribució normal multivariable . Concretament, si (suposem un nombre natural), i llavors Aquesta propietat es demostra utilitzant la tècnica de Cramer-Wold, juntament amb la propietat que hem vist sobre les combinacions lineals de les components d'un vector amb distribució multivariable i la convergència de la distribució de Student a la distribució normal.
Sigui . Les següents dues propietats es demostren a partir de la representació (3).
Esperança
Si , llavors el vector té esperança i
Matriu de variàncies-covariàncies.
Si , aleshores la matriu de variàncies-covariàncies del vector és:Moments d'ordre superior. [4]
Ens restringirem al cas que i . Sigui i nombres naturals tals que . Aleshores i si són parells, aleshores Si algun dels és senar, aleshores l'esperança anterior és 0.
Aquesta propietat es demostra a partir de la representació (1), de la independència de i , i les fórmules per als moments d'una distribució i dels d'una distribució khi quadrat.
La funció característica no té una expressió senzilla. Vegeu [1] o.[6][7]
La definició constructiva d'una distribució t multivariant serveix simultàniament com a algorisme de mostreig:
- Generar i , independentment.
- Calcular .
Aquesta formulació dona lloc a la representació jeràrquica d'una distribució t multivariant com una mixtura d'escala de normals: Si on indica una distribució gamma amb densitat proporcional a , i condicionalment segueix .
- ↑ 1,0 1,1 Kotz, Samuel; Nadarajah, Saralees. Multivariate T-Distributions and Their Applications. Cambridge: Cambridge University Press, 2004, p. 36. DOI 10.1017/cbo9780511550683. ISBN 978-0-521-82654-9.
- ↑ 2,0 2,1 2,2 Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J: Wiley-Interscience, 2003, p. 55. ISBN 978-0-471-36091-9.
- ↑ Seber, G.A.F.. A Matrix Handbook for Statisticians. Wiley, 2008, p. 221, ítem 10.2.
- ↑ 4,0 4,1 Fang, Kaitai; Kotz, Samuel; Ng, Kai-Wang. Symmetric multivariate and related distributions. Reissued 2018. Milton: CRC Press, 2018, p. 32-33, 85-88. ISBN 978-1-315-89794-3.
- ↑ Ding, Peng «On the Conditional Distribution of the Multivariate t Distribution». The American Statistician, 70, 3, 2016, pàg. 293–295. ISSN: 0003-1305.
- ↑ Sutradhar, Brajendra C. «On the Characteristic Function of Multivariate Student t-Distribution». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 14, 4, 1986, pàg. 329–337. DOI: 10.2307/3315191. ISSN: 0319-5724.
- ↑ «Addendum to Dagum and Sutradhar». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 16, 3, 1988, pàg. 323–323. DOI: 10.2307/3314742. ISSN: 0319-5724.