Distribució multinomial de DirichletTipus | Distribució de probabilitat composta i distribució conjunta |
---|
Notació | |
---|
Paràmetres | nombre de proves (enter positiu)
|
---|
Suport |
|
---|
fpm | [1] |
---|
Esperança matemàtica | |
---|
Variància |
|
---|
FGM | amb [1] |
---|
FC |
amb
[1] |
---|
FGP |
amb
[1] |
---|
En teoria i estadística de probabilitats, la distribució multinomial de Dirichlet és una família de distribucions de probabilitat multivariables discretes sobre un suport finit de nombres enters no negatius. També s'anomena distribució multinomial composta de Dirichlet (DCM) o distribució multivariada de Pólya (en honor a George Pólya).
És una distribució de probabilitat composta, on un vector de probabilitat p s'extreu d'una distribució de Dirichlet amb vector de paràmetres , i una observació extreta d'una distribució multinomial amb vector de probabilitat p i nombre de proves n. El vector de paràmetres de Dirichlet captura la creença prèvia sobre la situació i es pot veure com un pseudocompte: observacions de cada resultat que es produeixen abans que es recullin les dades reals. La combinació correspon a un esquema d'urna Pólya.
Es troba freqüentment en l'estadística bayesiana, l'aprenentatge automàtic, els mètodes empírics de Bayes i l'estadística clàssica com una distribució multinomial sobredispersa.[2][3]
Es redueix a la distribució categòrica com a cas especial quan n = 1. També s'aproxima bé la distribució multinomial arbitràriament per a α gran. El multinomial de Dirichlet és una extensió multivariant de la distribució binomial beta, ja que les distribucions multinomial i Dirichlet són versions multivariables de la distribució binomial i distribucions beta, respectivament.[4]
Dirichlet-multinomial com a distribució composta
[modifica]
La distribució de Dirichlet és una distribució conjugada a la distribució multinomial. Aquest fet condueix a una distribució composta analíticament tractable. Per a un vector aleatori de categories compta , distribuït segons una distribució multinomial, la distribució marginal s'obté integrant a la distribució de p que es pot considerar com un vector aleatori seguint una distribució de Dirichlet:
que dona lloc a la següent fórmula explícita:
on es defineix com la suma . Una altra forma per a aquesta mateixa distribució composta, escrita de manera més compacta en termes de la funció beta, B, és la següent:
La distribució multinomial de Dirichlet s'utilitza en la classificació i agrupació de documents automatitzada, la genètica, l'economia, el modelatge de combat i el màrqueting quantitatiu.[5]
|
---|
|
Distribucions discretes amb suport finit | |
---|
Distribucions discretes amb suport infinit | |
---|
Distribucions contínues suportades sobre un interval acotat | |
---|
Distribucions contínues suportades sobre un interval semi-infinit | |
---|
Distribucions contínues suportades en tota la recta real | |
---|
Distribucions contínues amb el suport de varis tipus | |
---|
Barreja de distribució variable-contínua | |
---|
Distribució conjunta | |
---|
Direccionals | |
---|
Degenerada i singular | |
---|
Famílies | |
---|