Distribució multinomial de Dirichlet

Distribució multinomial de Dirichlet
Tipus	Distribució de probabilitat composta i distribució conjunta
Notació
Paràmetres	nombre de proves (enter positiu);
Suport	;
fpm
Esperança matemàtica
Variància	;
FGM	; amb;
FC	; amb;
FGP	; amb;

En teoria i estadística de probabilitats, la distribució multinomial de Dirichlet és una família de distribucions de probabilitat multivariables discretes sobre un suport finit de nombres enters no negatius. També s'anomena distribució multinomial composta de Dirichlet (DCM) o distribució multivariada de Pólya (en honor a George Pólya).

És una distribució de probabilitat composta, on un vector de probabilitat p s'extreu d'una distribució de Dirichlet amb vector de paràmetres ${\boldsymbol {\alpha }}$ , i una observació extreta d'una distribució multinomial amb vector de probabilitat p i nombre de proves n. El vector de paràmetres de Dirichlet captura la creença prèvia sobre la situació i es pot veure com un pseudocompte: observacions de cada resultat que es produeixen abans que es recullin les dades reals. La combinació correspon a un esquema d'urna Pólya.

Es troba freqüentment en l'estadística bayesiana, l'aprenentatge automàtic, els mètodes empírics de Bayes i l'estadística clàssica com una distribució multinomial sobredispersa.^[2]^[3]

Es redueix a la distribució categòrica com a cas especial quan n = 1. També s'aproxima bé la distribució multinomial arbitràriament per a α gran. El multinomial de Dirichlet és una extensió multivariant de la distribució binomial beta, ja que les distribucions multinomial i Dirichlet són versions multivariables de la distribució binomial i distribucions beta, respectivament.^[4]

Especificació

Dirichlet-multinomial com a distribució composta

La distribució de Dirichlet és una distribució conjugada a la distribució multinomial. Aquest fet condueix a una distribució composta analíticament tractable. Per a un vector aleatori de categories compta $\mathbf {x} =(x_{1},\dots ,x_{K})$ , distribuït segons una distribució multinomial, la distribució marginal s'obté integrant a la distribució de p que es pot considerar com un vector aleatori seguint una distribució de Dirichlet:

$\Pr(\mathbf {x} \mid n,{\boldsymbol {\alpha }})=\int _{\mathbf {p} }\mathrm {Mult} (\mathbf {x} \mid n,\mathbf {p} )\mathrm {Dir} (\mathbf {p} \mid {\boldsymbol {\alpha }}){\textrm {d}}\mathbf {p}$

que dona lloc a la següent fórmula explícita:

$\Pr(\mathbf {x} \mid n,{\boldsymbol {\alpha }})={\frac {\Gamma \left(\alpha _{0}\right)\Gamma \left(n+1\right)}{\Gamma \left(n+\alpha _{0}\right)}}\prod _{k=1}^{K}{\frac {\Gamma (x_{k}+\alpha _{k})}{\Gamma (\alpha _{k})\Gamma \left(x_{k}+1\right)}}$

on $\alpha _{0}$ es defineix com la suma $\alpha _{0}=\sum \alpha _{k}$ . Una altra forma per a aquesta mateixa distribució composta, escrita de manera més compacta en termes de la funció beta, B, és la següent:

$\Pr(\mathbf {x} \mid n,{\boldsymbol {\alpha }})={\frac {nB\left(\alpha _{0},n\right)}{\prod _{k:x_{k}>0}x_{k}B\left(\alpha _{k},x_{k}\right)}}.$

Usos

La distribució multinomial de Dirichlet s'utilitza en la classificació i agrupació de documents automatitzada, la genètica, l'economia, el modelatge de combat i el màrqueting quantitatiu.^[5]

Referències

↑ ^1,0 ^1,1 ^1,2 ^1,3 Glüsenkamp «Probabilistic treatment of the uncertainty from the finite size of weighted Monte Carlo data» (en anglès). EPJ Plus, 133(6), 2018. arXiv: 1712.01293. Bibcode: 2018EPJP..133..218G. DOI: 10.1140/epjp/i2018-12042-x.
↑ «The Dirichlet-multinomial distribution» (en anglès). Universitat de Conrent. [Consulta: 8 juliol 2023].
↑ «Dirichlet distribution vs Multinomial distribution?» (en anglès). Stack exchange. [Consulta: 8 juliol 2023].
↑ «Understanding Dirichlet–Multinomial Models» (en anglès). Gregory Gundersen. [Consulta: 8 juliol 2023].
↑ «The Dirichlet Distribution: What Is It and Why Is It Useful?» (en anglès). Built In. [Consulta: 8 juliol 2023].

[Gluesenkamp2018-1] 1,0 ^1,1 ^1,2 ^1,3 Glüsenkamp «Probabilistic treatment of the uncertainty from the finite size of weighted Monte Carlo data» (en anglès). EPJ Plus, 133(6), 2018. arXiv: 1712.01293. Bibcode: 2018EPJP..133..218G. DOI: 10.1140/epjp/i2018-12042-x.

[2] «The Dirichlet-multinomial distribution» (en anglès). Universitat de Conrent. [Consulta: 8 juliol 2023].

[3] «Dirichlet distribution vs Multinomial distribution?» (en anglès). Stack exchange. [Consulta: 8 juliol 2023].

[4] «Understanding Dirichlet–Multinomial Models» (en anglès). Gregory Gundersen. [Consulta: 8 juliol 2023].

[5] «The Dirichlet Distribution: What Is It and Why Is It Useful?» (en anglès). Built In. [Consulta: 8 juliol 2023].

[1]

[2]

[3]

[4]

[5]

Distribucions de probabilitat
Llista
Distribucions discretes amb suport finit	Benford Bernoulli Beta-binomial Binomial Binomial de Poisson Categòrica Hipergeomètrica Rademacher Uniforme discreta Zipf Zipf-Mandelbrot
Distribucions discretes amb suport infinit	Beta-binomial negativa Binomial negativa estesa Borel Conway-Maxwell-Poisson Delaporte Tipus fase Fractal parabòlica Gauss-Kuzmin Geomètrica Logarítmica Poisson mixta Skellam Yule-Simon Zeta
Distribucions contínues suportades sobre un interval acotat	Arcsinus ARGUS Balding-Nichols Bates Beta no central rectangular Cosinus elevat Irwin-Hall Kumaraswamy Logit-normal Parabòlica PERT Recíproca Triangular Uniforme Wigner
Distribucions contínues suportades sobre un interval semi-infinit	Benini Benktander Beta prima Burr χ χ2 inversa inversa escalada no central Dagum Davis Erlang Exponencial Exponencial-logarítmic F no central Flory-Schulz Fréchet Gamma Gamma/Gompertz Gamma inversa Gaussiana inversa Gaussiana inversa generalitzada Gompertz Gompertz desplaçada Gumbel de tipus II hiper-Erlang Hiperexponencial Hipoexponencial Kolmogórov-Smirnov Lambda de Wilks Lévy Log-Cauchy Log-Laplace Log-logística Log-normal Lomax Matriu exponencial Maxwell-Boltzmann Maxwell-Jüttner Mig-logística Mittag-Leffler Nakagami Normal plegada Normal truncada Pareto Poly-Weibull Rayleigh Relativista de Breit-Wigner Rice Seminormal T² de Hotelling Tipus fase Weibull Discreta de Weibull
Distribucions contínues suportades en tota la recta real	Asimètrica de Laplace Cauchy Estable Geomètrica estable Gumbel Gumbel de tipus I Hiperbòlica generalitzada Hiperbòlica secant Holtsmark Landau Laplace Logística Normal generalitzada Normalinversa de Skew Q gaussiana S_U de Johnson Slash t no central t d'Student Tracy-Widom Variància-gamma Voigt Z de Fisher
Distribucions contínues amb el suport de varis tipus	Lambda de Tukey Log-logística desplaçada Marchenko-Pastur Pareto generalitzada q gaussiana q exponencial q de Weibull Valor extrem generalitzada
Barreja de distribució variable-contínua	Rectificada gaussiana
Distribució conjunta	Discreta Ewens Multinomial Multinomial de Dirichlet Multinomial negativa Contínua Dirichlet Dirichlet generalitzada Estable multivariant Gamma normal Gamma normal inversa Normal multivariable t multivariable Matriu de valor Matriu gamma Matriu gamma inversa Matriu normal Normal de Wishart Normal de Wishart inversa t matriu Wishart Wishart inversa
Direccionals	Univariada (circular) Asimètrica de Laplace envoltada Cauchy envoltada Exponencial envoltada Lévy envoltada Normal envoltada Circular uniforme Univariada de von Mises Bivariada (esfèrica) Kent Bivariada (toroidal) Bivariada de von Mises Multivariada von Mises-Fisher Bingham
Degenerada i singular	Degenerada Delta de Dirac Singular Cantor
Famílies	Barreja Circular Composta de Poisson El·líptica Envoltada Exponencial Exponencial natural Màxima entropia Pearson Tweedie Ubicació-escala

Distribució multinomial de Dirichlet
Tipus	Distribució de probabilitat composta i distribució conjunta
Notació	$\mathrm {DirMult} (n,{\boldsymbol {\alpha }})$
Paràmetres	$n>0$ nombre de proves (enter positiu) $\alpha _{1},\ldots ,\alpha _{K}>0$
Suport	$x_{i}\in \{0,\dots ,n\}$ $\Sigma x_{i}=n\!$
fpm	${\frac {\Gamma \left(\sum \alpha _{k}\right)\Gamma \left(n+1\right)}{\Gamma \left(n+\sum \alpha _{k}\right)}}\prod _{k=1}^{K}{\frac {\Gamma (x_{k}+\alpha _{k})}{\Gamma (\alpha _{k})\Gamma \left(x_{k}+1\right)}}$ ^[1]
Esperança matemàtica	$\operatorname {E} (X_{i})=n{\frac {\alpha _{i}}{\sum \alpha _{k}}}$
Variància	$\operatorname {Var} (X_{i})=n{\frac {\alpha _{i}}{\sum \alpha _{k}}}\left(1-{\frac {\alpha _{i}}{\sum \alpha _{k}}}\right)\left({\frac {n+\sum \alpha _{k}}{1+\sum \alpha _{k}}}\right)$ $\textstyle {\mathrm {Cov} }(X_{i},X_{j})=-n{\frac {\alpha _{i}\alpha _{j}}{(\sum \alpha _{k})^{2}}}\left({\frac {n+\sum \alpha _{k}}{1+\sum \alpha _{k}}}\right)~~(i\neq j)$
FGM	$\operatorname {E} (\prod \limits _{k=1}^{K}{e}^{t_{k}\cdot x_{k}})={\frac {\Gamma (n+1)\Gamma (\sum \alpha _{k})}{\Gamma (\sum \alpha _{k}+n)}}\cdot D_{n}({\boldsymbol {\alpha }},(e^{t_{1}},...,e^{t_{K}}))$ amb $D_{n}={\frac {1}{n}}\sum \limits _{u=1}^{n}\left[\left(\sum \limits _{k=1}^{K}\alpha _{k}\cdot {e}^{t_{k}\cdot u}\right)D_{n-u}\right],D_{0}=1$ ^[1]
FC	$\operatorname {E} (\prod \limits _{k=1}^{K}{e}^{it_{k}\cdot x_{k}})={\frac {\Gamma (n+1)\Gamma (\sum \alpha _{k})}{\Gamma (\sum \alpha _{k}+n)}}\cdot D_{n}({\boldsymbol {\alpha }},(e^{it_{1}},...,e^{it_{K}}))$ amb $D_{n}={\frac {1}{n}}\sum \limits _{u=1}^{n}\left[\left(\sum \limits _{k=1}^{K}\alpha _{k}\cdot {e}^{it_{k}\cdot u}\right)D_{n-u}\right],D_{0}=1$ ^[1]
FGP	$\operatorname {E} (\prod \limits _{k=1}^{K}{z_{k}}^{x_{k}})={\frac {\Gamma (n+1)\Gamma (\sum \alpha _{k})}{\Gamma (\sum \alpha _{k}+n)}}\cdot D_{n}({\boldsymbol {\alpha }},\mathbf {z} )$ amb $D_{n}={\frac {1}{n}}\sum \limits _{u=1}^{n}\left[\left(\sum \limits _{k=1}^{K}\alpha _{k}\cdot {z_{k}}^{u}\right)D_{n-u}\right],D_{0}=1$ ^[1]