La referència bàsica d'aquest article és Johnson et al..
Sigui una variable aleatòria normal estàndard i una variable aleatòria amb distribució amb graus de llibertat, i independents. La variable es diu que té una distribució de Student amb graus de llibertat i s'escriu o bé .
Comentari sobre els graus de llibertat. El cas més habitual d'una distribució és quan el nombre de graus de llibertat és un nombre natural i llavors es pot interpretar com la suma dels quadrats de variables aleatòries normals estàndard independents. Però mitjançant la funció de densitat es pot definir una distribució que tingui com a graus de llibertat qualsevol nombre real estrictament positiu , nombre que continua anomenat-se els graus de llibertat de la distribució [2]. En conseqüència, pot definir-se la distribució de Student amb graus de llibertat qualsevol nombre . Cal dir que el programari estadístic estàndard, per exemple, el llenguatge R, utilitza graus de llibertat fraccionaris en certs tests estadístics.
La funció de densitat de la distribució de Student amb graus de llibertat és
|
on és la funció gamma.
Utilitzant la funció Beta i que també es pot escriure Funció parella. Cal remarcar que aquesta funció és parella : ; gràficament, és simètrica respecte l'eix d'ordenades. Aquesta propietat és important en els càlculs de probabilitats.
Prova
El càlcul de la funció de densitat de
es fa mitjançant la fórmula de canvi de variables per a
vectors aleatoris. Concretament, amb les notacions que hem introduït a la definició de
, considerem la funció
que transforma el vector
en el vector
:
La transformació inversa és
El determinant jacobià d'aquesta transformació és D'altra banda, degut a que i són independents, la densitat conjunta del vector és el producte de les funcions de densitat:
Llavors, la densitat conjunta de
és
La densitat (marginal) de
és
on, per calcular la integral, hem fet el canvi de variable
i hem utilitzat la
funció gamma.
Quan és un nombre natural, la funció de densitat és simplifica. Concretament,per a , Llavors i per tant es tracta d'una distribució de Cauchy (centrada en l'origen).
Per a senar, la constant de la funció de densitat és on és el doble factorial del nombre .
Per a parell, (Cal recordar que =1).
Quan el nombre de graus de llibertat és un nombre natural, la funció de distribució es pot donar explícitament en termes de funcions elementals, amb una expressió que es complica a l'augmentar els graus de llibertat.
|
Funció de densitat
|
Funció de distribució
|
1
|
|
|
2
|
|
|
3
|
|
|
4
|
|
|
5
|
|
|
Prova
El càlcul de la funció de distribució es redueix a calcular una integral de la forma
, amb
i
o
amb
i
un nombre senar . En ambdós casos, mitjançant el canvi
n'hi ha prou amb considerar
.
Tenim que
i per a , la integral és una integral d'una funció racional amb arrels complexes múltiples, que dóna[3] La integral per a senar, mitjançant el canvi es converteix en una integral de la forma , que es pot calcular iterativament (vegeu la fórmula de la integral d'una potència del cosinus), i acaba donant [3] :
Calculem, per exemple, la funció de distribució per a : hem de calcular
Llavors,
Expressions alternatives de la funció de distribució
[modifica]
Per al cas general podem escriure la funció de densitat en termes de la funció beta incompleta:
on i és la funció beta incompleta regularitzada.
Per a , atès que la funció de densitat és parella, el càlcul de és fa per arguments de simetria.
Prova
Fixat
, tenim que
on hem utilitzat la simetria respecte l'eix d'ordenades de la funció de densitat
. A la darrera integral fem el canvi
amb la qual cosa aquesta integral queda
on
és la funció Beta i és la funció Beta incompleta regularitzada
. D'on es dedueix la fórmula per a
.
També, per a , es pot escriure la funció de distribució en termes d'una funció hipergeomètrica
on és una funció hipergeomètrica.
Sigui un nombre natural. Aleshores
- Si , tenim que
- Si , llavors , i en conseqüència el moment d'ordre no existeix.
En el cas parell, , també tenim
En particular, si , llavors . Si , llavors
Prova
El càlcul dels moments és senzill si es parteix de la definició de la variable
i no de la funció de densitat. Comencem estudiant quan existeixen els moments de
. D'acord amb la seva definició i les notacions que hem introduït,
on hem utilitzat que
i
són independents i positives. Atès que una
variable normal té moments de tots els ordres, l'expressió anterior serà finita o no segons ho sigui
. Tenim que
Fen el canvi , la integral de la dreta dóna quan , i en cas contrari.
Ara, per calcular els moments quan , és a dir, si , repetim els càlculs anteriors sense el valor absolut tenint en compte que per a una variable normal estàndard tenimD'on
En aquesta secció considerem els graus de llibertat un nombre natural. Sigui , aleshores per a gran, és aproximadament normal estàndard .
Prova
Considerem una successió de variables aleatòries
, independents, totes amb distribució normal estàndard
. D'una banda, la successió
està formada per variables aleatòries independents, amb esperança
; per la
llei forta dels grans nombres,
Llavors,
En conseqüència, per les relacions entre els diversos tipus de
convergència de variables aleatòries,
Però, d'altra banda,que és el que volíem demostrar.
Alternativament, si designem per la funció de densitat de la distribució , aplicant les propietats asimptòtiques de la funció gamma i calculant un límit del nombre , es demostrar que
d'on, per les propietats de la
convergència en distribució, s'obté també l'aproximació normal a la distribució
.
Quan el nombre de graus de llibertat és una nombre natural, hi ha formules per la funció característica de la distribució de Student, que depenen de si els graus de llibertat son senars o parells, fórmules que cada cop són més complicades a l'augmentar el nombre de graus de llibertat. Una fórmula general utilitzant funcions especials va ser obtinguda el 1995 independentment per S. Hurst i A. H. Jorder (veieu [8]). Concretament, si ,
on és la funció de Bessel modificada de segon tipus.
La distribució t de Student en Estadística
[modifica]
El paper central que té distribució de Student en la inferència estadística de poblacions normals és degut al següent teorema [9]:
Teorema. Sigui una mostra d'una població normal , és a dir, les variables aleatòries són independents i totes tenen distribució . Considerem la mitjana mostral Aleshores:
- Les variables aleatòries i són independents.
- Sigui
on és la variància mostral. Llavors, .
|
Vegeu la pàgina de la distribució per a la demostració dels punts 1 i 2. El punt 3 es dedueix del fet que i de les parts 1 i 2 i de la definició de la distribució de Student.
Vegeu la pàgina Interval de confiança per a exemples concrets d'utilització de la distribució de Student.
Relació amb altres distribucions
[modifica]
- La distribució coincideix amb la distribució de Cauchy.
- Si , aleshores té una distribució amb 1 i graus de llibertat: .
- ↑ Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions, Volume 1. 2nd ed. New York: Wiley, 1994, p. 417. ISBN 0-471-58495-9.
- ↑ 3,0 3,1 Gradshteĭn, I. S.. Table of integrals, series and products. 7th ed. Oxford: Academic, 2007, p. 96, fórmula 2.263.3. ISBN 978-0-12-373637-6.
- ↑ Gaunt, Robert E. «A simple proof of the characteristic function of Student’s t -distribution» (en anglès). Communications in Statistics - Theory and Methods, 50, 14, 18-07-2021, pàg. 3380–3383. DOI: 10.1080/03610926.2019.1702695. ISSN: 0361-0926.
- ↑ DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374 i 379-380. ISBN 0-201-64405-3.
- Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions, Volume 2. 2nd ed. New York: Wiley, 1995. ISBN 0-471-58494-0.