Usuari:Freutci/normal2

Notacions. Seguint les convencions de l'àlgebra lineal, escriurem tots els vectors en columna i identificarem $\mathbb {R} ^{d}$ amb el conjunt de vectors reals $d$ -dimensionals. Denotarem per ${\boldsymbol {U}}'$ la transposada de la matriu o del vector ${\boldsymbol {U}}$ .

Definició

Hi ha diferents definicions (equivalents) de vector aleatori normal. Des del punt de vista tècnic, la més directa i que permet fer demostracions més curtes, utilitza funcions característiques ^[1] ^[2]. Altres autors comencen pel vector aleatori normal amb densitat i posteriorment consideren el cas general ^[3] ^[4]. En aquest article, seguint Hoffman-Jorgensen ^[5] o Serfling ^[6], utilitzarem la caracterització dels vectors aleatoris normals com aquells vectors aleatoris tals que qualsevol combinació lineal de les seves components és una variable aleatòria normal. Concretament,

Definició. Un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'$ es diu que és normal multidimensional, o que té distribució normal multidimensional si per qualsevol ${\boldsymbol {\lambda }}=(\lambda _{1},\dots ,\lambda _{d})^{\prime }\in \mathbb {R} ^{d}$ , la variable aleatòria ${\boldsymbol {\lambda 'X}}=\sum _{i=1}^{d}\lambda _{i}X_{i}$ té distribució normal.

Totes les component del vector ${\boldsymbol {X}}$ tenen distribució normal, ja que, per exemple, $X_{1}=(1,0,\dots ,0)^{\prime }{\boldsymbol {X}}.$ En conseqüència, el vector té vector d'esperances i matriu de variàncies covariàncies, que designarem per ${\boldsymbol {\mu }}$ i ${\boldsymbol {\Sigma }}$ respectivament: ${\boldsymbol {\mu }}=E[{\boldsymbol {X}}]={\big (}E[X_{1}],\dots ,E[X_{d}]{\big )}'\quad {\text{i}}\quad {\boldsymbol {\Sigma }}={\big (}{\text{Cov}}(X_{i},X_{j}){\big )}_{i,j=1\dots ,d}.$ S'escriu ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Quan $d=1$ , es tracta d'una variable aleatòria normal amb mitjana $\mu$ i variància $\sigma ^{2}={\boldsymbol {\Sigma }}$ , i s'escriu ${\mathcal {N}}(\mu ,\sigma ^{2})$ en lloc de ${\mathcal {N}}_{1}(\mu ,\sigma ^{2})$ .

Casos no singular i singular

La matriu de variàncies-covariàncies ${\boldsymbol {\Sigma }}$ sempre és semidefinida positiva. Quan el seu determinant

Primera definició: vector aleatori normal amb funció de densitat

Començarem pel cas més senzill i habitual que el vector aleatori normal tingui densitat, també anomenat vector aleatori normal no singular. Correspon a quan la matriu de variàncies-covariances té determinant diferent de zero, que implica que és una matriu definida positiva. Més endavant veurem el cas general.

Definició. Un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'$ es diu que és normal multidimensional (no singular) ^[7] si té funció de densitat $f({\boldsymbol {x}})={\frac {1}{(2\pi )^{d/2}({\text{det}}\ {\boldsymbol {\Sigma }})^{1/2}}}\,e^{-{\tfrac {1}{2}}({\boldsymbol {x}}-{\boldsymbol {\mu }})'{\boldsymbol {\Sigma }}^{-1}({\boldsymbol {x}}-{\boldsymbol {\mu }})},\quad {\boldsymbol {x}}=(x_{1},\dots ,x_{d})'\in \mathbb {R} ^{d},\quad \quad \quad (1)$ on ${\boldsymbol {\mu }}=(\mu _{1},\dots ,\mu _{d})'\in \mathbb {R} ^{d}$ , ${\boldsymbol {\Sigma }}$ és una matriu (real) $d\times d$ definida positiva ^[8] i ${\text{det}}\ {\boldsymbol {\Sigma }}>0$ és el seu determinant. S'escriu ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . . Pot donar-se una definició menys explícita, com la següent ^[9]: Un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'$ es diu que és normal multidimensional si té funció de densitat de la forma $f({\boldsymbol {x}})=C\,e^{-K({\boldsymbol {x}})},\,{\boldsymbol {x}}=(x_{1},\dots ,x_{d})'\in \mathbb {R} ^{d},$ on $C$ és una constant normalitzadora (per tal que la integral de $f$ sobre $\mathbb {R} ^{d}$ sigui 1) i $K({\boldsymbol {x}})$ és una forma quadràtica definida positiva en $x_{1},\dots ,x_{d}$ . Llavors, utilitzant les propietats de les funcions de densitat i de les formes quadràtiques definides positives es dedueix l'expressió (1).

Propietats.

En aquesta secció només veurem les propietats dels vectors aleatoris normals multidimensionals que necessitem per introduir la definició general. Per veure una llista més completa, veieu la secció Propietats més avall.

1. Esperança i matriu de variàncies-covariàncies. Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ .

L'esperança del vector és $E[{\boldsymbol {X}}]={\big (}E[X_{1}],\dots ,E[X_{d}]{\big )}'={\boldsymbol {\mu }}$ . La matriu de variàncies-covariàncies (o matriu de dispersió) és ${\boldsymbol {V}}({\boldsymbol {X}})={\big (}{\text{Cov}}(X_{i},X_{j}){\big )}_{i,j=1\dots ,d}={\boldsymbol {\Sigma }}.$ 2. Les combinacions lineals de les components d'un vector aleatori normal són variables aleatòries normals.

Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ i ${\boldsymbol {\lambda }}\in \mathbb {R} ^{d}$ . Definim $T={\boldsymbol {\lambda 'X}}=\sum _{i=1}^{d}\lambda _{i}X_{i}.$ Aleshores $T\sim {\mathcal {N}}(\mu _{T},\sigma _{T}^{2})$ on $\mu _{T}={\boldsymbol {\lambda '\mu }}\quad {\text{i}}\quad \sigma _{T}^{2}={\boldsymbol {\lambda '\Sigma \lambda }}.$

3. Les transformacions afins de vectors aleatoris normals donen vectors aleatoris normals

Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Considerem ${\boldsymbol {b}}\in \mathbb {R} ^{d}$ i ${\boldsymbol {C}}$ una matriu $d\times d$ no singular, és a dir, amb ${\text{det}}\ {\boldsymbol {C}}\neq 0$ . Definim ${\boldsymbol {Y}}={\boldsymbol {CX}}+{\boldsymbol {b}}.$ Aleshores ^[10] ${\boldsymbol {Y}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu _{Y}}},{\boldsymbol {\Sigma _{Y}}})$ amb ${\boldsymbol {\mu _{Y}}}={\boldsymbol {C\mu }}+{\boldsymbol {b}}\quad {\text{i}}\quad {\boldsymbol {\Sigma _{Y}}}={\boldsymbol {C\Sigma C'}}.$ En particular, atès que existeix una única matriu definida positiva ${\boldsymbol {\Sigma }}^{1/2}$ tal que ${\boldsymbol {(}}\Sigma ^{1/2})^{2}={\boldsymbol {\Sigma }}$ ^[11], anomenada arrel quadrada de ${\boldsymbol {\Sigma }}$ , i designem per ${\boldsymbol {\Sigma }}^{-1/2}$ la seva inversa ^[12], aleshores ${\boldsymbol {\Sigma }}^{-1/2}{\big (}{\boldsymbol {X}}-{\boldsymbol {\mu }}{\big )}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d}),\quad \quad (2)$ on ${\boldsymbol {I}}_{d}$ és la matriu identitat de dimensió $d$ . Recíprocament, si ${\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ , aleshores ${\boldsymbol {\mu }}+{\boldsymbol {\Sigma }}^{1/2}{\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }}).\qquad \qquad (3)$ Alguns autors anomenen ${\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ vector normal multidimensional estàndard, en analogia a la variable normal estàndard.

Observació. Les dues propietats (2) i (3) poden formular-se sense utilitzar la matriu arrel quadrada: de la propietat 3 es dedueix que si ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ i ${\boldsymbol {D}}$ és una matriu $d\times d$ tal que ${\boldsymbol {DD'}}={\boldsymbol {\Sigma }}^{-1}$ , aleshores ${\boldsymbol {D}}{\big (}{\boldsymbol {X}}-{\boldsymbol {\mu }}{\big )}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ . I recíprocament, si ${\boldsymbol {B}}$ compleix ${\boldsymbol {BB'}}={\boldsymbol {\Sigma }}$ i , ${\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ aleshores ${\boldsymbol {\mu }}+{\boldsymbol {B}}{\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ .

Funció característica i funció generatriu de moments

Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Aleshores la seva funció característica és ^[13] $\varphi _{\boldsymbol {X}}({\boldsymbol {t}})=E[e^{i{\boldsymbol {t}}'{\boldsymbol {X}}}]=e^{i\,{\boldsymbol {t}}'{\boldsymbol {\mu }}-{\boldsymbol {t}}'{\boldsymbol {\Sigma }}{\boldsymbol {t}}/2},\quad {\boldsymbol {t}}\in \mathbb {R} ^{d}.\qquad \qquad (4)$ En particular, per a ${\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ , $\varphi _{\boldsymbol {Z}}({\boldsymbol {t}})=e^{-{\boldsymbol {t}}'{\boldsymbol {\boldsymbol {t}}}/2},\quad {\boldsymbol {t}}\in \mathbb {R} ^{d}.\qquad (3)$

A més, ${\boldsymbol {X}}$ té funció generatriu de moments en tot $\mathbb {R} ^{d}$ i val ^[14] $M_{\boldsymbol {X}}({\boldsymbol {t}})=E[e^{{\boldsymbol {t}}'{\boldsymbol {X}}}]=e^{\,{\boldsymbol {t}}'{\boldsymbol {\mu }}+{\boldsymbol {t}}'{\boldsymbol {\Sigma }}{\boldsymbol {t}}/2},\quad {\boldsymbol {t}}\in \mathbb {R} ^{d}.$

Demostracions

Començarem veient la propietat de la transformació afí d'un vector normal muldimensional, de la qual deduirem les altres. Concretament, anem a veure que si ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ amb funció de densitat $f({\boldsymbol {x}})={\frac {1}{(2\pi )^{d/2}({\text{det}}\ {\boldsymbol {\Sigma }})^{1/2}}}\,e^{-{\tfrac {1}{2}}({\boldsymbol {x}}-{\boldsymbol {\mu }})'{\boldsymbol {\Sigma }}^{-1}({\boldsymbol {x}}-{\boldsymbol {\mu }})},\quad {\boldsymbol {x}}=(x_{1},\dots ,x_{d})'\in \mathbb {R} ^{d},$ i ${\boldsymbol {C}}$ una matriu $d\times d$ amb ${\text{det}}\ {\boldsymbol {C}}\neq 0$ , i ${\boldsymbol {b}}\in \mathbb {R} ^{d}$ , aleshores el vector ${\boldsymbol {Y}}={\boldsymbol {CX}}+{\boldsymbol {b}}$ és normal multidimensional ${\boldsymbol {Y}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu _{Y}}},{\boldsymbol {\Sigma _{Y}}})$ amb ${\boldsymbol {\mu _{Y}}}={\boldsymbol {C\mu }}+{\boldsymbol {b}}\quad {\text{i}}\quad {\boldsymbol {\Sigma _{Y}}}={\boldsymbol {C\Sigma C'}}.$ En efecte, aquesta propietat resulta de la fórmula de la transformació d'un vector aleatori amb densitat, utilitzant l'aplicació $h:\mathbb {R} ^{d}\to \mathbb {R} ^{d}$ definida per ${\boldsymbol {y}}=h({\boldsymbol {x}})={\boldsymbol {Cx}}+{\boldsymbol {b}}.$ L'aplicació inversa és ${\boldsymbol {x}}=g({\boldsymbol {y}})=h^{-1}({\boldsymbol {y}})={\boldsymbol {C}}^{-1}({\boldsymbol {y}}-{\boldsymbol {b}}).$ La matriu jacobiana de $g$ és $J_{g}={\boldsymbol {C}}^{-1}$ . Llavors, la densitat de ${\boldsymbol {Y}}$ és $f_{\boldsymbol {Y}}({\boldsymbol {y}})={\frac {1}{(2\pi )^{d/2}(\mathrm {det} {\boldsymbol {\Sigma }})^{1/2}}}\,e^{-{\tfrac {1}{2}}{\big (}{\boldsymbol {C}}^{-1}({\boldsymbol {y}}-{\boldsymbol {b}})-{\boldsymbol {\mu }}{\big )}^{\prime }\Sigma ^{-1}{\big (}{\boldsymbol {C}}^{-1}({\boldsymbol {y}}-{\boldsymbol {b}})-{\boldsymbol {\mu }}{\big )}}\,\vert {\text{det}}\,{\boldsymbol {C}}^{-1}\vert ={\frac {1}{(2\pi )^{d/2}({\text{det}}\,{\boldsymbol {\Sigma }})^{1/2}\,\vert {\text{det}}\,{\boldsymbol {C}}\vert }}\,e^{-{\tfrac {1}{2}}({\boldsymbol {y}}-{\boldsymbol {b}}-{\boldsymbol {C}}{\boldsymbol {\mu }})^{\prime }({\boldsymbol {C}}^{-1})^{\prime }{\boldsymbol {\Sigma }}^{-1}{\boldsymbol {C}}^{-1}({\boldsymbol {y}}-{\boldsymbol {b}}-{\boldsymbol {C}}{\boldsymbol {\mu }})}.$ Ara només falta comprovar que $({\boldsymbol {C}}^{-1})^{\prime }{\boldsymbol {\Sigma }}^{-1}{\boldsymbol {C}}^{-1}=({\boldsymbol {C}}{\boldsymbol {\Sigma }}{\boldsymbol {C}}')^{-1},$ que és evident, i que $({\text{det}}\,{\boldsymbol {\Sigma }})^{1/2}\,\vert {\text{det}}\,{\boldsymbol {C}}\vert ={\big (}({\text{det}}({\boldsymbol {C}}{\boldsymbol {\Sigma }}{\boldsymbol {C}}'){\big )}^{1/2},$ que equival a veure que ${\text{det}}\,{\boldsymbol {\Sigma }}\,({\text{det}}\,{\boldsymbol {C}})^{2}={\text{det}}({\boldsymbol {C}}{\boldsymbol {\Sigma }}{\boldsymbol {C}}'),$ la qual cosa també és clara. Per tant, tenim demostrada la propietat 3. L'expressió (2) es dedueix prenent ${\boldsymbol {C}}={\boldsymbol {\Sigma }}^{-1/2}$ i ${\boldsymbol {b}}=-{\boldsymbol {\Sigma }}^{-1/2}{\boldsymbol {\mu }}$ . De manera anàloga s'obté (3). Les formulacions alternatives d'aquestes dues expressions sense utilitzar la matriu arrel quadrada es dedueixen directament de la propietat 3.

Anem a demostrar la propietat 1: Començarem pel cas ${\boldsymbol {Z}}=(Z_{1},\dots ,Z_{d})'\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ , on tenim que ${\boldsymbol {\mu }}={\boldsymbol {0}}$ i ${\boldsymbol {\Sigma }}={\boldsymbol {I}}_{d}$ . La seva funció de densitat és $f_{\boldsymbol {Z}}({\boldsymbol {x}})={\frac {1}{(2\pi )^{d/2}}}\,e^{-{\boldsymbol {x}}'{\boldsymbol {x}}/2},\quad {\boldsymbol {x}}=(x_{1},\dots ,x_{d})'\in \mathbb {R} ^{d},\qquad \qquad (4)$ que factoritza en el producte $f_{\boldsymbol {Z}}(x_{1},\dots ,x_{d})={\frac {1}{\sqrt {2\pi }}}e^{-x_{1}^{2}/2}\cdots {\frac {1}{\sqrt {2\pi }}}e^{-x_{d}^{2}/2},$ i, per tant, les variables $Z_{1},\dots ,Z_{n}$ són independents i amb llei normal estàndard ${\mathcal {N}}(0,1)$ . D'on es dedueix que $E[{\boldsymbol {Z}}]={\boldsymbol {0}}$ i ${\boldsymbol {V}}({\boldsymbol {Z}})={\boldsymbol {I}}_{d}$

Ara, quan ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ , escrivint ${\boldsymbol {X}}={\boldsymbol {\mu }}+{\boldsymbol {\Sigma }}^{1/2}{\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }}),$ on ${\boldsymbol {Z}}={\boldsymbol {\Sigma }}^{-1/2}{\big (}{\boldsymbol {X}}-{\boldsymbol {\mu }}{\big )}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ , i aplicant les propietats de l'esperança d'un vector aleatori i de la matriu de variàncies covariàncies , deduïm que $E[{\boldsymbol {X}}]={\boldsymbol {\mu }}$ i que ${\boldsymbol {V}}({\boldsymbol {X}})={\boldsymbol {\Sigma }}$ .

Per calcular la funció característica, comencem també per calcular-la per a ${\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ . Atès que hem vist que les variables aleatòries $Z_{1},\dots ,Z_{d}$ són independents, la funció característica de ${\boldsymbol {Z}}\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ serà el producte de les funcions característiques de les corresponents a $Z_{1},\dots ,Z_{d}$ , això és, $\varphi _{\boldsymbol {Z}}({\boldsymbol {t}})=\varphi _{Z_{1}}(t_{1})\cdots \varphi _{Z_{d}}(t_{d})=e^{-t_{1}^{2}/2}\cdots e^{-t_{d}^{2}/2}=e^{-{\boldsymbol {t}}'{\boldsymbol {\boldsymbol {t}}}/2},\quad {\boldsymbol {t}}\in \mathbb {R} ^{d}.\qquad \quad (5)$ La funció característica del vector aleatori ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ s'obté aplicant les propietats de les funcions característiques.

Finalment, la propietat 2 es dedueix calculant la funció característica de la variable $T={\boldsymbol {\lambda 'X}}=\sum _{i=1}^{d}\lambda _{i}X_{i}.$

Vector aleatori normal bidimensional o bivariant

Com exemple considerem el cas particular $d=2$ . Sigui ${\boldsymbol {X}}=(X_{1},X_{2})'\sim {\mathcal {N}}_{2}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Tindrem $E{\begin{pmatrix}X_{1}\\X_{2}\end{pmatrix}}={\begin{pmatrix}\mu _{1}\\\mu _{2}\end{pmatrix}}.$ La matriu de variàncies covariàncies serà ${\boldsymbol {\Sigma }}={\begin{pmatrix}\sigma _{11}&\sigma _{12}\\\sigma _{21}&\sigma _{22}\end{pmatrix}}={\begin{pmatrix}\sigma _{1}^{2}&\rho \sigma _{1}\sigma _{2}\\\rho \sigma _{1}\sigma _{2}&\sigma _{2}^{2}\end{pmatrix}},$ on $\sigma _{11}=\sigma _{1}^{2}={\text{Var}}(X_{1})=E[X_{1}^{2}]-\mu _{1}^{2},$ anàlogament $\sigma _{22}=\sigma _{2}^{2}$ és la variància de $X_{2}$ , i $\rho$ és el coeficient de correlació entre $X_{1}$ i $X_{2}$ : $\rho ={\frac {{\text{Cov}}(X_{1},X_{2})}{\sqrt {{\text{Var}}(X_{1})\,{\text{Var}}(X_{2})}}}={\frac {\sigma _{12}}{\sigma _{1}\sigma _{2}}}.$ La inversa de ${\boldsymbol {\Sigma }}$ és ${\boldsymbol {\Sigma }}^{-1}={\frac {1}{1-\rho ^{2}}}\,{\begin{pmatrix}1/\sigma _{1}^{2}&-\rho /(\sigma _{1}\sigma _{2})\\-\rho /(\sigma _{1}\sigma _{2})&1/\sigma _{2}^{2}\end{pmatrix}}.$ Llavors, la funció de densitat de ${\boldsymbol {X}}$ és $f(x_{1},x_{2})={\frac {1}{2\pi \sigma _{1}\sigma _{2}{\sqrt {1-\rho ^{2}}}}}\,{\text{exp}}{\Big \{}-{\frac {1}{2(1-\rho ^{2})}}{\Big [}{\frac {(x_{1}-\mu _{1})^{2}}{\sigma _{1}^{2}}}-2\rho \,{\frac {(x_{1}-\mu _{1})(x_{2}-\mu _{2})}{\sigma _{1}\sigma _{2}}}+{\frac {(x_{2}-\mu _{2})^{2}}{\sigma _{2}^{2}}}{\Big ]}{\Big \}}.$

Segona definició: cas general

En aplicacions importants, com per exemple la distribució dels residus en models de regressió lineal o la distribució asimptòtica de la distribució multinomial que dóna lloc al test de la $\chi ^{2}$ de Pearson, es fa palesa la necessitat d'utilitzar vectors normals que tenen matriu de variàncies-covariàncies amb determinant nul (matriu singular), que s'anomenen vectors aleatoris normals singulars o degenerats ^[15]; necessàriament aquests vectors no tenen funció de densitat i per tant, cal modificar la definició inicial.

En aquest context, els llibres donen tres definicions (equivalents) de vector aleatori normal multidimensional general a partir de les propietats que hem vist anteriorment. Les definicions (a) i (c) es troben a Seber ^[16] i la (b) a Ash ^[17]

(a) Es diu que un vector aleatori

{\boldsymbol {X}}

és normal multidimensional si qualsevol combinació lineal de les seves components és una variable aleatòria normal.

(b) Sigui

{\boldsymbol {\Sigma }}

una matriu

d\times d

semidefinida positiva i

{\boldsymbol {\mu }}\in \mathbb {R} ^{d}

. Un vector aleatori

{\boldsymbol {X}}

es diu que és normal multidimensional

{\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})

si té funció característica

$\varphi _{\boldsymbol {X}}({\boldsymbol {t}})=e^{i\,{\boldsymbol {t}}'{\boldsymbol {\mu }}-{\boldsymbol {t}}'{\boldsymbol {\Sigma }}{\boldsymbol {t}}/2},\quad {\boldsymbol {t}}\in \mathbb {R} ^{d}.\qquad \qquad (6)$

(c) Sigui

{\boldsymbol {\Sigma }}

una matriu

d\times d

semidefinida positiva i

{\boldsymbol {\mu }}\in \mathbb {R} ^{d}

. Un vector aleatori

{\boldsymbol {X}}

es diu que és normal multidimensional

{\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})

si té la mateixa llei que

{\boldsymbol {BZ}}+{\boldsymbol {\mu }},

on

{\boldsymbol {Z}}\sim {\mathcal {N}}_{k}({\boldsymbol {0}},{\boldsymbol {I}}_{k})

(és dir, té funció de densitat (4)), i

{\boldsymbol {B}}

és qualsevol matriu

d\times k

tal que

{\boldsymbol {BB'}}={\boldsymbol {\Sigma }}

(sempre existeix al menys una matriu

B

amb aquestes característiques ^[18]).

Notació. A partir d'ara, utiitzarem la notació ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ per referir-nos a un vector aleatori normal $d$ -dimensional, ja sigui no singular o singular.

Demostració.

Vegem que (a) $\Rightarrow$ (b). Suposem que ${\boldsymbol {X}}$ compleix la condició expressada a (a). En primer lloc, cada component d'aquest vector té esperança i variància ja que, per exemple, $X_{1}=(1,0,\dots ,0)'{\boldsymbol {X}}$ , i, per hipòtesi, és normal. Llavors ${\boldsymbol {X}}$ tindrà esperança, que designem per ${\boldsymbol {\mu }}$ i matriu de variàncies-covariàncies que denotarem per ${\boldsymbol {\Sigma }}$ . Fixem ${\boldsymbol {t}}\in \mathbb {R} ^{d}$ i sigui $T=t'{\boldsymbol {X}}\sim {\mathcal {N}}(\mu _{T},\sigma _{T}^{2})$ ; anem a calcular $\mu _{T}$ i $\sigma _{T}$ : per les propietats de l'esperança d'un vector aleatori i de la matriu de variàncies-covariàncies, $\mu _{T}=E[T]={\boldsymbol {t}}'E[{\boldsymbol {X}}]={\boldsymbol {t'\mu }}\quad {\text{i}}\quad \sigma _{Y}^{2}={\text{Var}}({\boldsymbol {t}}'{\boldsymbol {X}})={\boldsymbol {t'\Sigma t}}.$ Aleshores, podem calcular la funció característica de ${\boldsymbol {X}}$ de la següent manera: $\varphi _{\boldsymbol {X}}({\boldsymbol {t}})=E[e^{i{\boldsymbol {t}}'{\boldsymbol {X}}}]=\varphi _{T}(1)=e^{i\mu _{T}-\sigma _{T}^{2}/2}=e^{i\,{\boldsymbol {t}}'{\boldsymbol {\mu }}-{\boldsymbol {t}}{\boldsymbol {\Sigma }}{\boldsymbol {t}}'/2},$ que és el que volíem demostrar.

Vegem que (b) $\Rightarrow$ (c). En efecte, suposem ${\boldsymbol {\Sigma }}$ te rang $k$ . Aleshores, existeix una matriu ${\boldsymbol {B}}$ $d\times k$ de rang $k$ tal que ${\boldsymbol {BB'}}={\boldsymbol {\Sigma }}$ ^[18]. Sigui ${\boldsymbol {Z}}\sim {\mathcal {N}}_{k}({\boldsymbol {0}},{\boldsymbol {I}}_{k})$ i definim ${\boldsymbol {U}}={\boldsymbol {BZ}}+{\boldsymbol {\mu }}$ . El vector ${\boldsymbol {U}}$ té la mateixa distribució que ${\boldsymbol {X}}$ , ja que la funció característica de ${\boldsymbol {U}}$ és (vegeu les propietats de les funcions característiques multidimensionals) $\varphi _{\boldsymbol {U}}({\boldsymbol {t}})=e^{i{\boldsymbol {t'\mu }}}\varphi _{\boldsymbol {Z}}({\boldsymbol {B't}})=e^{i{\boldsymbol {t'\mu }}}\exp\{-{\boldsymbol {t'BI_{d}B't}}/2\}=\varphi _{\boldsymbol {X}}({\boldsymbol {t}}),\quad {\boldsymbol {t}}\in \mathbb {R} ^{d}.$ Finalment, vegem que (c) $\Rightarrow$ (a). Sigui ${\boldsymbol {\lambda }}\in \mathbb {R} ^{d}$ . Aleshores ${\boldsymbol {\lambda 'X}}$ tindrà la mateixa llei (amb les notacions anteriors) que ${\boldsymbol {\lambda 'U}}={\boldsymbol {\lambda 'BZ}}+{\boldsymbol {\lambda '\mu }}$ i llavors, per a $t\in \mathbb {R}$ , $\varphi _{\boldsymbol {\lambda 'U}}(t)=e^{it{\boldsymbol {\lambda '\mu }}}\varphi _{\boldsymbol {\lambda 'BZ}}(t)=e^{it{\boldsymbol {\lambda '\mu }}}\varphi _{\boldsymbol {Z}}({\boldsymbol {B'\lambda t}})=e^{it{\boldsymbol {\lambda '\mu }}}\,\exp\{-({\boldsymbol {B'\lambda }}t)'{\boldsymbol {B'\lambda }}t/2\}=e^{it{\boldsymbol {\lambda '\mu }}}\,e^{-{\boldsymbol {\lambda '\Sigma \lambda }}\,t^{2}/2},$ on hem utilitzat que la funció característica del vector ${\boldsymbol {Z}}\sim {\mathcal {N}}_{k}({\boldsymbol {0}},{\boldsymbol {I}}_{k})$ té l'expressió (1). Per tant ${\boldsymbol {\lambda 'U}}$ (i, llavors ${\boldsymbol {\lambda 'X}}$ ) té una distribució normal.

Exemple. Considerem una variable normal estàndard $Z\sim {\mathcal {N}}(0,1)$ . Definim el vector aleatori ${\boldsymbol {X}}=(Z,-Z)^{\prime }={\begin{pmatrix}~~1\\-1\end{pmatrix}}Z.$ La seva matriu de variàncies-covariàncies és ${\boldsymbol {\Sigma }}={\begin{pmatrix}~~1&-1\\-1&~~1\end{pmatrix}},$ que té rang 1.

D'altra banda, aquest vector està concentrat en la recta $r=\{(x,y):\ y=-x\}$ , és a dir, $P{\big (}(Z,-Z)\in r{\big )}=1$ ; però llavors, no pot tenir funció de densitat, ja que si existís una funció $f(x,y)$ no negativa tal que per a qualsevol conjunt borelià $B\subset \mathbb {R} ^{2}$ tinguéssim $P{\big (}(Z,-Z)\in B{\big )}=\iint _{B}f(x,y)\,dx\,dy,$ aleshores $P{\big (}(Z,-Z)\in r{\big )}=\iint _{r}f(x,y)\,dx\,dy=0,$ ja que $r$ té mesura de Lebesgue 0 en el pla, la qual cosa és contradictori amb $P{\big (}(Z,-Z)\in r{\big )}=1$ .

És clar que tota combinació lienal de les components de ${\boldsymbol {X}}$ és una variable normal. La seva funció característica és $\varphi _{\boldsymbol {X}}(s,t)=E(e^{-(s-t)^{2}/2}),$ però $(s,t){\begin{pmatrix}~~1&-1\\-1&~~1\end{pmatrix}}{\begin{pmatrix}s\\t\end{pmatrix}}=(s-t)^{2},$ i, per tant, la funció característica té la forma (6). Finalment, tal com hem vist, ${\boldsymbol {X}}={\boldsymbol {B}}Z$ , amb ${\boldsymbol {B}}=(-1,1)^{\prime }$ , que satisfà ${\boldsymbol {BB'}}={\boldsymbol {\Sigma }}$ i per tant també es compleix la condició donada a la definició (c). En resum, ${\boldsymbol {X}}$ és un vector aleatori normal bidimensional.

Notació. A partir d'ara, anomenarem vector normal multidimensional a un vector aleatori quec compleixi una de les condicions (equivalents) (a), (b) o (c).

Existència de vectors aleatoris normals.

En el cas no singular, l'existència de vectors aleatoris normals ve donada per resultats generals de la teoria de la probabilitat. Concretament, existeix un espai de probabilitat $(\Omega ,{\mathcal {A}},P)$ i un vector aleatori ${\boldsymbol {X}}:\mathbb {R^{d}} \to \mathbb {R}$ que té funció de densitat (1) ^[19]

En relació amb el cas singular, utilitzant la terminologia de Loeve ^[20] , les definicions (a) i (b) són descriptives, mentre que (c) és constructiva. Si es parteix d'(a) o (b) cal demostrar l'existència de l'objecte matemàtic que compleix aquesta propietat: ¿existeix un vector aleatori que complexi la propietat enunciada a (a)? ¿Existeix un vector aleatori tal que tingui (6) per funció característica? la resposta a ambdues preguntes ve donada per l'equivalència amb la definició (c).

Propietats.

1. Transformacions lineals. Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ , amb ${\boldsymbol {\Sigma }}$ semidefinida positiva, ${\boldsymbol {C}}$ una matriu $k\times d$ i ${\boldsymbol {b}}\in \mathbb {R} ^{k}$ . Definim ${\boldsymbol {Y}}={\boldsymbol {CX}}+{\boldsymbol {b}}.$ Aleshores ^[10] ${\boldsymbol {Y}}\sim {\mathcal {N}}_{k}({\boldsymbol {\mu _{Y}}},{\boldsymbol {\Sigma _{Y}}})$ amb ${\boldsymbol {\mu _{Y}}}={\boldsymbol {C\mu }}+{\boldsymbol {b}}\quad {\text{i}}\quad {\boldsymbol {\Sigma _{Y}}}={\boldsymbol {C\Sigma C'}}.$ Suposem ara que $k\leq d$ . Si ${\boldsymbol {X}}$ és no singular i ${\rm {rang}}\,{\boldsymbol {C}}=k$ , aleshores ${\boldsymbol {Y}}$ és no singular.

Demostració: La funció característica de ${\boldsymbol {Y}}$ és (vegeu les propietats de les funcions característiques multidimensionals) $\varphi _{\boldsymbol {Y}}({\boldsymbol {t}})=e^{i{\boldsymbol {t'b}}}\,\varphi _{\boldsymbol {X}}({\boldsymbol {C't}})=e^{i{\boldsymbol {t'b}}}e^{i{\boldsymbol {t'C\mu }}}e^{{\boldsymbol {t'C\Sigma C't}}/2}=e^{i{\boldsymbol {t'\mu _{Y}}}+{\boldsymbol {t'\Sigma _{Y}t}}/2},\qquad {\boldsymbol {t}}\in \mathbb {R} ^{k}.$ Per veure que si ${\boldsymbol {X}}$ és no singular i ${\rm {rang}}\,{\boldsymbol {C}}=k$ , aleshores ${\boldsymbol {Y}}$ és no singular, utilitzarem que en aquestes condicions ${\boldsymbol {C\Sigma C'}}$ és definida positiva ^[21] .

2. Distribucions marginals. Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Aleshores qualsevol subvector és normal multidimensional.

Demostració. Només cal utilitzar que qualsevol subvector es pot escriure de la forma

{\boldsymbol {CX}}

per a una matriu convenient

{\boldsymbol {C}}

i aplicar la propietat anterior

3. Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ , amb ${\boldsymbol {\Sigma }}$ semidefinida positiva.

(i) Si

{\boldsymbol {\Sigma }}

és definida positiva (cas no singular), això és,

{\text{det}}\ {\boldsymbol {\Sigma }}>0

, aleshores

{\boldsymbol {X}}

té funció de densitat donada per (1).

(ii) Si

{\text{det}}\ {\boldsymbol {\Sigma }}=0

(cas singular), aleshores

{\boldsymbol {X}}

no té funció de densitat. Si el rang de

{\boldsymbol {\Sigma }}

és

r<d

, llavors

{\boldsymbol {X}}

està concentrada en un subespai lineal de

\mathbb {R} ^{d}

de dimensió

r

^[22].

En efecte ^[23], siguin

\lambda _{1},\dots ,\lambda _{r}

els valors propis no nuls de

{\boldsymbol {\Sigma }}

. Existeix una matriu ortogonal

d\times d

{\boldsymbol {Q}}

tal que

{\boldsymbol {Q'\Sigma Q}}={\boldsymbol {D}}={\begin{pmatrix}\lambda _{1}\\&\lambda _{2}\\&&\ddots \\&&&\lambda _{r}\\&&&&0\\&&&&&\ddots \\&&&&&&0\end{pmatrix}}.

Definim ${\boldsymbol {Y}}={\boldsymbol {Q}}'({\boldsymbol {X}}-{\boldsymbol {\mu }}),$ que és un vector normal amb vector d'esperances ${\boldsymbol {0}}$ i matriu de variàncies-covariàncies ${\rm {\bf {Var}}}({\boldsymbol {Y}})={\boldsymbol {Q'\Sigma Q}}={\boldsymbol {D}}.$ Per tant, ${\boldsymbol {Y}}=(Y_{1},\dots ,Y_{r},0,\dots ,0)^{\prime }$ . Definim ${\boldsymbol {V}}=(Y_{1},\dots ,Y_{r})^{\prime }$ , que segons la propietat anterior serà normal no singular ${\mathcal {N}}_{r}({\boldsymbol {0}},{\boldsymbol {D}}^{*})$ on ${\boldsymbol {D}}^{*}={\begin{pmatrix}\lambda _{1}\\&\lambda _{2}\\&&\ddots \\&&&\lambda _{r}\\\end{pmatrix}}.$ Sigui ${\boldsymbol {R}}$ la matriu formada per les primeres r columnes de la matriu ${\boldsymbol {C}}$ . Llavors, ${\boldsymbol {X}}={\boldsymbol {Q}}{\boldsymbol {Y}}+{\boldsymbol {\mu }}={\boldsymbol {R}}{\boldsymbol {V}}+{\boldsymbol {\mu }}.$ Això implica que el vector ${\boldsymbol {X}}$ està concentrat en el subespai lineal de $\mathbb {R} ^{d}$ de dimensió $r$ :

$\{{\boldsymbol {x}}={\boldsymbol {C}}{\boldsymbol {y}}+{\boldsymbol {\mu }},\,{\boldsymbol {y}}\in \mathbb {R} ^{d}\}=\{{\boldsymbol {x}}={\boldsymbol {R}}{\boldsymbol {u}}+{\boldsymbol {\mu }},\,{\boldsymbol {u}}\in \mathbb {R} ^{r}\}.$ 4. Independència. Dues variables aleatòries independents són incorrelacionades, o sigui, la seva covariància és zero. En general el recíproc no és cert. però és veritat quan les variables tenen distribució conjunta normal.

(i) Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . Aleshores les variables aleatòries $X_{1},\dots ,X_{d}$ són independents si i només si ${\rm {Cov}}(X_{i},X_{j})=0,\ i\neq j$ ^[24]. Equivalentment, si la matriu ${\boldsymbol {\Sigma }}$ és diagonal.

(ii) Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ , i $2\leq r\leq d$ . Escrivim ${\boldsymbol {X}}_{1}=(X_{1},\dots ,X_{r-1})'\quad {\text{i}}\quad {\boldsymbol {X}}_{2}=(X_{r},\dots ,X_{d})'$ ${\boldsymbol {\mu }}_{1}=E[{\boldsymbol {X}}_{1}]=(\mu _{1},\dots ,\mu _{r-1})'\quad {\text{i}}\quad {\boldsymbol {\mu }}_{2}=E[{\boldsymbol {X}}_{2}]=(\mu _{r},\dots ,\mu _{d})'.$ D'altra banda, partim la matriu ${\boldsymbol {\Sigma }}$ de la següent manera: ${\boldsymbol {\Sigma }}={\begin{pmatrix}{\boldsymbol {\Sigma }}_{11}&{\boldsymbol {\Sigma }}_{12}\\\Sigma _{21}&{\boldsymbol {\Sigma }}_{22}\end{pmatrix}},$ on ${\boldsymbol {\Sigma }}_{12}$ és matriu de covariàncies dels vectors ${\boldsymbol {X}}_{1}$ i ${\boldsymbol {X}}_{2}$ , ${\boldsymbol {\Sigma }}_{12}={\boldsymbol {C}}({\boldsymbol {X}}_{1},{\boldsymbol {X}}_{2})={\big (}{\rm {Cov}}(X_{n},X_{m}{\big )}_{n=1,\dots ,r-1 \atop m=r,\dots ,d~~}.$ Noteu que ${\boldsymbol {\Sigma }}_{21}={\boldsymbol {\Sigma }}_{12}'$ . Aleshores ${\boldsymbol {X}}_{1}$ i ${\boldsymbol {X}}_{2}$ són independents si i només si ${\boldsymbol {\Sigma }}_{12}={\boldsymbol {0}}$ ^[25].

(iii) La propietat anterior es generalitza a qualsevol partició del vector ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ en vectors ${\boldsymbol {X}}_{1},\dots ,{\boldsymbol {X}}_{k}$ : aquests vectors són independents si i només si les matrius de covariàncies ${\boldsymbol {C}}({\boldsymbol {X}}_{i},{\boldsymbol {X}}_{j})={\boldsymbol {0}},\ i\neq j$ ^[26].

Demostració: La demostració de les tres propietats es basa en el fet que quan les covariàncies són zero, aleshores la funció característica del vector descomposa en producte de les funcions característiques de les components. Vegeu les referències esmentades.

5. Constància de la densitat sobre el·lipsoides. Si ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ és no singular, aleshores la seva funció de densitat és constant sobre els el·lipsoides $d$ -dimensionals de la forma $({\boldsymbol {x}}-{\boldsymbol {\mu }})'{\boldsymbol {\Sigma }}^{-1}({\boldsymbol {x}}-{\boldsymbol {\mu }})=c,$ per a qualsevol $c\in \mathbb {R}$ . Es diu que és una distribució amb simetria el·líptica ^[27] .

Quan ${\boldsymbol {\Sigma }}=\sigma {\boldsymbol {I}}_{d}$ , aleshores els el·lipsoides anteriors són esferes i es diu que la distribució té simetria esfèrica ^[27].

6. Moments. Fórmula d'Isserlis o de Wick. Atès que un vector aleatori normal té funció generatriu de moments, tindrà moments de tots els ordres, i com que la distribució del vector només depèn de les mitjanes i les covariàncies de les components, els moments només deprendran d'aquestes quantitats; tot i aquesta consideració a priorística, és realment sorprenent que es pugui trobar una fórmula per als moments tan elegant i simple com la que presentem a continuació.

Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'\sim {\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {\Sigma }})$ (les components poden ser iguals). Aleshores $E[X_{1}\dots X_{d}]=\sum \prod _{i_{k},j_{k}}E[X_{i_{k}}X_{j_{k}}],$ on la suma es fa sobre totes les descomposicions del conjunt $\{1,2,\dots ,d\}$ en parelles disjuntes $\{i_{k},\,j_{k}\}$ .

Per exemple, $E[X_{1}X_{2}X_{3}X_{4}]=E[X_{1}X_{2}]\,E[X_{3}X_{4}]+E[X_{1}X_{3}]\,E[X_{3}X_{4}]+E[X_{1}X_{4}]\,E[X_{2}X_{3}],$ ja que el conjunt $\{1,2,\dots ,4\}$ es pot descomposar de 3 maneres en parelles: les parelles $\{1,2\},\,\{3,4\}$ , les parelles $\{1,3\},\,\{2,4\}$ i les parelles $\{1,4\},\,\{2,3\}$ .

Quan hi ha variables repetides, es fan les identificacions a la fórmula anterior: per exemple, per calcular $E[X_{1}^{2}X_{2}^{2}]$ , prenem $X_{3}=X_{1}$ i $X_{4}=X_{2}$ . Llavors, $E[X_{1}^{2}X_{2}^{2}]=E[X_{1}^{2}]\,E[X_{2}^{2}]+2(E[X_{1}X_{2}])^{2}.$

Anàlogament, $E[X_{1}^{2}X_{2}X_{3}]=E[X_{1}^{2}]\,E[X_{2}X_{3}]+2\,E[X_{1}X_{2}]\,E[X_{1}X_{3}].$ $E[X_{1}^{3}X_{2}]=3E[X_{1}^{2}]\,E[X_{1}X_{2}].$ $E[X_{1}^{4}]=3(E[X_{1}^{2}])^{2}.$

Observacions.

Si $d$ és senar, aleshores $E[X_{1}\dots X_{d}]=0$ , ja que $1,2,\dots ,d$ no pot descomposar-se en parelles. D'altra banda, aquesta propietat pot demostrar-se directament del fet que totes les variables tenen esperanza 0, i llavors el vector $(X_{1},\dots ,X_{d})$ té la mateixa distribució que el vector $(-X_{1},\dots ,-X_{d})$ . En ser $d$ senar, $E[X_{1}\dots X_{d}]=-E[X_{1}\dots X_{d}]$ .
Com que totes les variables tenen esperança zero, $E[X_{i}X_{j}]={\rm {Cov}}[X_{i},X_{j}]$ . Sovint s'escriu la formula anterior utilitzant la notació $\sigma _{ij}={\rm {Cov}}(X_{i},X_{j})$ amb $\sigma _{ii}=\sigma _{i}^{2}={\rm {Var}}(X_{i})$ .
Per a un nombre parell $d=2k$ , el nombre de parelles en que descomposa $\{1,2,\dots ,d\}$ és ${\frac {(2k)!}{2^{k}\,k!}}={\frac {(2k-1)!}{2^{k-1}\,(k-1)!}}=(2k-1)(2k-3)\cdots 1=(2k-1)!!=(d-1)!!,$ on $n!!$ denota el doble factorial de $n$ . Així, per exemple, per a $d=4$ , tenim que el nombre de parelles és $3!!=3\cdot 1=3$ ; per $d=6$ tenim $5!!=5\cdot 3\cdot 1=15$ .
Aquesta fórmula va ser descoberta per Isserlis^[28] però també és coneguda com a fórmula de Wick a partir del seu treball de Física teòrica ^[29]. Isserlis va demostrar la fórmula per inducció; veieu una demostració utilitzant funcions característiques a Janson ^[30]
Quan totes les variables són iguals, $X_{1}=\dots =X_{d}=X\sim {\cal {N}}(0,\sigma ^{2})$ aleshores tenim la coneguda fórmula pels moments de les variables normals centrades ^[31] $E[X^{d}]={\begin{cases}(d-1)!!\,\sigma ^{d},&{\text{si}}\ d\ {\text{és parell}},\\0,&{\text{si}}\ d\ {\text{és senar}}.\end{cases}}$
Per una extensió als moments d'un vector normal amb vector d'esperances no nul veieu Withers ^[32]
Per a altres fórmules pels moments d'un vector normal, vegeu Graybill^[33] , secció 10.9.

Comentaris sobre el vector aleatori normal bidimensional

Utilitzant les notacions que hem introduït a la secció Vector aleatori normal bidimensional, tenim que $X_{i}\sim {\mathcal {N}}(\mu _{i},\sigma _{i}^{2}),\ i=1,2$ .D'altra banda, ${\text{det}}{\boldsymbol {\Sigma }}=\sigma _{1}^{2}\sigma _{2}^{2}(1-\rho ^{2}).$ Per tant,

${\text{det}}{\boldsymbol {\Sigma }}=0\quad \iff \quad \rho =1.$ D'acord amb la propietat 3, i en coherència amb les propietats del coeficient de correlació, quan $\rho =1.$ hi ha una relació lineal entre $X_{1}$ i $X_{2}$ : existeixen nombres $a$ i $b$ tals que $X_{1}=aX_{2}+b,\quad {\text{quasi segurament}}.$

Distribucions condicionades.

Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ no singular. Amb les notacions anteriors tenim ^[34] la distribució $(X_{1},\dots ,X_{r-1})'$ condicionada per $X_{r}=x_{r},\dots ,X_{d}=x_{d}$ és normal mutidimensional ${\mathcal {N}}_{r-1}({\boldsymbol {\mu }}^{*},{\boldsymbol {\Sigma }}^{*})$ on ${\boldsymbol {\mu }}^{*}={\boldsymbol {\mu }}_{1}+{\boldsymbol {\Sigma }}_{12}{\boldsymbol {\Sigma }}_{22}^{-1}({\boldsymbol {x}}_{2}-{\boldsymbol {\mu }}_{2})\quad {\text{i}}\quad {\boldsymbol {\Sigma }}^{*}={\boldsymbol {\Sigma }}_{11}-{\boldsymbol {\Sigma }}_{12}{\boldsymbol {\Sigma }}_{22}^{-1}{\boldsymbol {\Sigma }}_{21}.$ Aquesta propietat també és cert quan ${\boldsymbol {X}}$ és singular canviant ${\boldsymbol {\Sigma }}_{22}^{-1}$ per una pseudoinversa (o inversa generalitzada) ${\boldsymbol {\Sigma }}_{22}^{-}$ ^[35].

Per la demostració, vegeu al referència citada.

En particular, per a $d=2$ , tenim que $X_{1}$ condicionada per $X_{2}=x_{2}$ té una distribució normal ${\mathcal {N}}(\mu ,\sigma ^{2})$ on $\mu =\mu _{1}+\rho \,{\frac {\sigma _{1}}{\sigma _{2}}}(x_{2}-\mu _{2})\quad {\text{i}}\quad \sigma ^{2}=\sigma _{1}^{2}(1-\rho ^{2}).$

Formes quadràtiques en variables normals

Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ i ${\boldsymbol {A}}=(a_{ij})$ una matriu $d\times d$ simètrica. Una expressió de forma ${\boldsymbol {X'AX}}=\sum _{i,j=1,\dots ,d}a_{ij}X_{i}X_{j}$ s'anomena una forma quadràtica en ${\boldsymbol {X}}$ . L'exemple més senzill és quan ${\boldsymbol {\mu }}={\boldsymbol {0}}$ , ${\boldsymbol {\Sigma }}={\boldsymbol {I}}_{d}$ i ${\boldsymbol {A}}={\boldsymbol {I}}_{d}$ . Llavors, la forma quadràtica té una distribució ji-quadrat amb $d$ graus de llibertat, $\chi _{d}^{2}$ , ja que llavors $X_{i}\sim {\mathcal {N}}(0,1),\ i=1,\dots ,n$ i son independents; llavors ${\boldsymbol {X'AX}}=\sum _{i,j=1,\dots ,d}X_{i}^{2}\sim \chi _{d}^{2}.$ Les formes quadràtiques en variables normals tenen un paper important en Estadística. Per un tractament en profunditat, veieu, per exemple, Seber, cap. 20 ^[36].

Propietats.

Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ no singular. Aleshores ${\boldsymbol {(X-\mu )'\Sigma ^{-1}(X-\mu )}}\sim \chi _{d}^{2}$ i ${\boldsymbol {X'\Sigma ^{-1}X}}\sim \chi _{d}^{2}(\delta )$ , on $\chi _{d}^{2}(\delta )$ és una una distribució ji-quadrat descentrada amb $d$ graus de llibertat i paràmetre de descentrament $\delta$ ; aquí $\delta ={\boldsymbol {\mu '\Sigma ^{-1}\mu }}$ .
Sigui ${\boldsymbol {X}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ no singular i ${\boldsymbol {A}}$ una matriu $d\times d$ simètrica de rang $r$ . Aleshores ${\boldsymbol {X'AX}}\sim \chi _{r}^{2}(\delta )$ amb $\delta ={\boldsymbol {\mu 'A\mu }}$ si i només si la matriu ${\boldsymbol {A\Sigma }}$ és idempotent: ${\boldsymbol {A\Sigma A\Sigma }}={\boldsymbol {A\Sigma }}$ .

↑ Nualart, David. Curs de probabilitats. Barcelona: PPU, 1990. ISBN 84-7665-718-8.
↑ Ash, Robert B. Probability and measure theory. 2nd ed. San Diego: Harcourt/Academic Press, 2000. ISBN 0-12-065202-1.
↑ Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003. ISBN 0-471-36091-0.
↑ Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003. ISBN 0-471-41540-5.
↑ Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, 1994. ISBN 0-412-05221-0.
↑ Serfling, Robert J. Approximation theorems of mathematical statistics. New York: Wiley, 2002. ISBN 0-471-21927-4.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 435, definició 20.11. ISBN 978-0-470-22678-0.
↑ Per definició, una matriu definida positiva o semidefinida positiva és simétrica.
↑ Kotz, S.; Balakridhnan, N.; Kotz, N. Continuous multivariate distributions. Vol. 1, Models and applications.. 2nd ed.. New York: Wiley, 2000, p. 167. ISBN 0-471-65403-5.
↑ ^10,0 ^10,1 Tong, Y. L.. The multivariate normal distribution. New York: Springer-Verlag, 1990, p. 26, Theorem 3.2.1. ISBN 0-387-97062-2.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 220, item 10.8. ISBN 978-0-470-22678-0.
↑ No hi ha ambiguitat en la notació ja que $({\boldsymbol {\Sigma }}^{1/2})^{-1}=({\boldsymbol {\Sigma }}^{-1})^{1/2}$ . Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 221, item 10.8 (f). ISBN 978-0-470-22678-0.
↑ Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 43. ISBN 0-471-36091-0.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 436, ítem 20.23(a). ISBN 978-0-470-22678-0.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 436. ISBN 978-0-470-22678-0.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 436. ISBN 978-0-470-22678-0.
↑ Ash, Robert B. Probability and measure theory. 2nd ed. San Diego: Harcourt/Academic Press, 2000, p. 449. ISBN 0-12-065202-1.
↑ ^18,0 ^18,1 Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 221, propietat 10.10. ISBN 978-0-470-22678-0.
↑ Una funció de densitat multidimensional determina de forma única una funció de distribució multidimensional, a partir de la qual pot construir-se un espai de probabilitat i un vector aleatori amb les propietats desitjades. Vegeu Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, 1994, p. 111. ISBN 0-412-05221-0.
↑ Loeve, Michel. Teoría de la probabilidad. Madrid: Tecnos, D.L. 1976. ISBN 84-309-0663-0. . Vegeu, per exemple, les pàgines 331 i següents.
↑ Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 461, prop. A.4.5. ISBN 0-471-41540-5.
↑ Nualart, David; Sanz, Marta. Curs de probabilitats. Barcelona: PPU, 1990, p. 128. ISBN 84-7665-718-8.
↑ Aquesta demostració està basada en l'anomenat Teorema de descomposició espectral de matrius semidefinides positives, vegeu Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 342. ISBN 978-0-470-22678-0.
↑ Ash, Robert B. Probability and measure theory. 2nd ed. San Diego: Harcourt/Academic Press, 2000, p. 453. ISBN 0-12-065202-1.
↑ Tong, Y. L.. The multivariate normal distribution. New York: Springer-Verlag, 1990, p. 30. ISBN 0-387-97062-2.
↑ Seber, G. A. F.. Multivariate observations. New York: John Wiley & Sons, Inc, 1984, p. 18. ISBN 0-471-88104-X.
↑ ^27,0 ^27,1 Fang, Kaitai. Symmetric multivariate and related distributions. London: Chapman and Hall, 1990. ISBN 0-412-31430-4.
↑ Isserlis, L. «ON A FORMULA FOR THE PRODUCT-MOMENT COEFFICIENT OF ANY ORDER OF A NORMAL FREQUENCY DISTRIBUTION IN ANY NUMBER OF VARIABLES» (en anglès). Biometrika, 12, 1-2, 01-11-1918, pàg. 134–139. DOI: 10.1093/biomet/12.1-2.134. ISSN: 0006-3444.
↑ Wick, G. C. «The Evaluation of the Collision Matrix» (en anglès). Physical Review, 80, 2, 15-10-1950, pàg. 268–272. DOI: 10.1103/PhysRev.80.268. ISSN: 0031-899X.
↑ Janson, Svante. Gaussian Hilbert spaces. Cambridge, U.K.: Cambridge University Press, 1997, p. 11-12. ISBN 0-521-56128-0.
↑ Papoulis, Athanasios. Probability, random variables, and stochastic processes. 4th ed. Boston: McGraw-Hill, 2002, p. 148. ISBN 0-07-366011-6.
↑ Withers, C. S. «The moments of the multivariate normal» (en anglès). Bulletin of the Australian Mathematical Society, 32, 1, 8-1985, pàg. 103–107. DOI: 10.1017/S000497270000976X. ISSN: 1755-1633.
↑ Graybill, Franklin A. «Secció 10.9». A: Matrices with applications in statistics. 2nd ed. Belmont, Calif.: Wadsworth International Group, 1983. ISBN 0-534-98038-4.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 439. ISBN 978-0-470-22678-0.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 437. ISBN 978-0-470-22678-0.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008. ISBN 978-0-470-22678-0.

[1] Nualart, David. Curs de probabilitats. Barcelona: PPU, 1990. ISBN 84-7665-718-8.

[2] Ash, Robert B. Probability and measure theory. 2nd ed. San Diego: Harcourt/Academic Press, 2000. ISBN 0-12-065202-1.

[3] Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003. ISBN 0-471-36091-0.

[4] Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003. ISBN 0-471-41540-5.

[5] Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, 1994. ISBN 0-412-05221-0.

[6] Serfling, Robert J. Approximation theorems of mathematical statistics. New York: Wiley, 2002. ISBN 0-471-21927-4.

[7] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 435, definició 20.11. ISBN 978-0-470-22678-0.

[8] Per definició, una matriu definida positiva o semidefinida positiva és simétrica.

[9] Kotz, S.; Balakridhnan, N.; Kotz, N. Continuous multivariate distributions. Vol. 1, Models and applications.. 2nd ed.. New York: Wiley, 2000, p. 167. ISBN 0-471-65403-5.

[:0-10] 10,0 ^10,1 Tong, Y. L.. The multivariate normal distribution. New York: Springer-Verlag, 1990, p. 26, Theorem 3.2.1. ISBN 0-387-97062-2.

[11] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 220, item 10.8. ISBN 978-0-470-22678-0.

[12] No hi ha ambiguitat en la notació ja que $({\boldsymbol {\Sigma }}^{1/2})^{-1}=({\boldsymbol {\Sigma }}^{-1})^{1/2}$ . Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 221, item 10.8 (f). ISBN 978-0-470-22678-0.

[13] Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 43. ISBN 0-471-36091-0.

[14] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 436, ítem 20.23(a). ISBN 978-0-470-22678-0.

[15] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 436. ISBN 978-0-470-22678-0.

[16] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 436. ISBN 978-0-470-22678-0.

[17] Ash, Robert B. Probability and measure theory. 2nd ed. San Diego: Harcourt/Academic Press, 2000, p. 449. ISBN 0-12-065202-1.

[:1-18] 18,0 ^18,1 Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 221, propietat 10.10. ISBN 978-0-470-22678-0.

[19] Una funció de densitat multidimensional determina de forma única una funció de distribució multidimensional, a partir de la qual pot construir-se un espai de probabilitat i un vector aleatori amb les propietats desitjades. Vegeu Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, 1994, p. 111. ISBN 0-412-05221-0.

[20] Loeve, Michel. Teoría de la probabilidad. Madrid: Tecnos, D.L. 1976. ISBN 84-309-0663-0. . Vegeu, per exemple, les pàgines 331 i següents.

[21] Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 461, prop. A.4.5. ISBN 0-471-41540-5.

[22] Nualart, David; Sanz, Marta. Curs de probabilitats. Barcelona: PPU, 1990, p. 128. ISBN 84-7665-718-8.

[23] Aquesta demostració està basada en l'anomenat Teorema de descomposició espectral de matrius semidefinides positives, vegeu Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 342. ISBN 978-0-470-22678-0.

[24] Ash, Robert B. Probability and measure theory. 2nd ed. San Diego: Harcourt/Academic Press, 2000, p. 453. ISBN 0-12-065202-1.

[25] Tong, Y. L.. The multivariate normal distribution. New York: Springer-Verlag, 1990, p. 30. ISBN 0-387-97062-2.

[26] Seber, G. A. F.. Multivariate observations. New York: John Wiley & Sons, Inc, 1984, p. 18. ISBN 0-471-88104-X.

[:2-27] 27,0 ^27,1 Fang, Kaitai. Symmetric multivariate and related distributions. London: Chapman and Hall, 1990. ISBN 0-412-31430-4.

[28] Isserlis, L. «ON A FORMULA FOR THE PRODUCT-MOMENT COEFFICIENT OF ANY ORDER OF A NORMAL FREQUENCY DISTRIBUTION IN ANY NUMBER OF VARIABLES» (en anglès). Biometrika, 12, 1-2, 01-11-1918, pàg. 134–139. DOI: 10.1093/biomet/12.1-2.134. ISSN: 0006-3444.

[29] Wick, G. C. «The Evaluation of the Collision Matrix» (en anglès). Physical Review, 80, 2, 15-10-1950, pàg. 268–272. DOI: 10.1103/PhysRev.80.268. ISSN: 0031-899X.

[30] Janson, Svante. Gaussian Hilbert spaces. Cambridge, U.K.: Cambridge University Press, 1997, p. 11-12. ISBN 0-521-56128-0.

[31] Papoulis, Athanasios. Probability, random variables, and stochastic processes. 4th ed. Boston: McGraw-Hill, 2002, p. 148. ISBN 0-07-366011-6.

[32] Withers, C. S. «The moments of the multivariate normal» (en anglès). Bulletin of the Australian Mathematical Society, 32, 1, 8-1985, pàg. 103–107. DOI: 10.1017/S000497270000976X. ISSN: 1755-1633.

[33] Graybill, Franklin A. «Secció 10.9». A: Matrices with applications in statistics. 2nd ed. Belmont, Calif.: Wadsworth International Group, 1983. ISBN 0-534-98038-4.

[34] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 439. ISBN 978-0-470-22678-0.

[35] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 437. ISBN 978-0-470-22678-0.

[36] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008. ISBN 978-0-470-22678-0.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]