Distribució binomial

Distribució binomial
	Funció de distribució de probabilitat
Tipus	Distribució binomial de Poisson, Panjer distribution (en) , Distribució multinomial, distribució univariant i distribució de probabilitat discreta
Paràmetres	nombre d'assaigs (sencer) ; probabilitat d'èxit (real)
Suport
FD
Esperança matemàtica
Mediana	o
Moda	o
Variància
Coeficient de simetria
Curtosi
Entropia
FGM
FC
Mathworld	BinomialDistribution

En Teoria de la probabilitat i en estadística, una variable aleatòria $X$ es diu que té una distribució binomial de paràmetres $n$ i $p$ si representa el nombre d'èxits en $n$ repeticions independents d'una prova que té probabilitat d'èxit $p$ . Per exemple, tirem 10 vegades un dau ordinari i comptem quantes vegades surt un 6; en aquest cas l'èxit és "treure un 6", i la variable que compta el nombre de sisos té una distribució binomial de paràmetres $n=10$ i $p=1/6$ .

La distribució binomial és la base de la popular prova binomial de significació estadística.^[2]

Va ser proposada pel matemàtic i físic suís Jacob Bernoulli.^[3]

Distribució de Bernoulli

Les distribucions binomials s'inscriuen en el marc de referència de les distribucions de Bernoulli. S'anomena experiència de Bernoulli aquell experiment aleatori del qual només s'estudia la verificació o no d'un esdeveniment $A$ que pot donar-se amb probabilitat $P(A)=p.$ La realització de l'esdeveniment $A$ s'anomena èxit. S'acostuma a representar la probabilitat del complementari (no $A$ ), la realització del qual s'anomena fracàs, per $P({\text{no}}\ A)=q;$ és clar que $p+q=1.$

Així, un experiment o experiència de Bernoulli es caracteritza per ser dicotòmic, és a dir, només són possibles dos resultats: èxit o fracàs.

Exemples d'experiències de Bernoulli

Es llança una moneda, l'esdeveniment A podria ser "que surti cara".
En una bossa hi ha boles blanques, negres i vermelles. traiem una bola i mirem si és de color blanc o no. L'esdeveniment A podria ser "treure bola blanca".
En un referèndum amb possibles respostes Sí o No, l'esdeveniment A podria ser "que surti Sí".

Distribució binomial

La distribució binomial és una distribució de probabilitat discreta que fa el recompte del nombre de vegades que es verifica l'èxit (realització de l'esdeveniment $A$ ) quan es repeteix $n$ vegades, de forma independent i en les mateixes condicions, una experiència de Bernouilli.

Per n = 1, la distribució binomial és una distribució de Bernoulli.

Designem per X la variable aleatòria que mesura el nombre d'èxits que s'han produït en els n experiments. Per indicar que segueix una distribució binomial de paràmetres n i p , s'escriu:

X\sim B(n,p)\,

Exemples

Les següents situacions són exemples d'experiments que poden modelitzar per aquesta distribució:

Es llança un dau deu vegades i es compta el nombre de sisos obtinguts: X ~ B(10, 1/6)
Es llança una moneda dues vegades i es compta el nombre de cares obtingudes, tenim $B(2,0'5).$
Una partícula es mou unidimensionalment amb probabilitat $q$ de moure's una unitat de distància cap enrere i $p=1-q$ de moure's una unitat cap endavant. Després de $n$ moviments, el nombre de vegades que s'ha mogut cap endavant és una variable binomial $B(n,p)$ .

Propietats característiques

Mitjana i Variància

Sigui $X\sim B(n,p)\,$ una variable aleatòria binomial de paràmetres $n$ i $p$ .

\mathbb {E} [X]=np\,

Això es dedueix per la linealitat de l'esperança, ja que $X$ és la suma de $n$ variables aleatòries de Bernoulli idèntiques, cadascuna d'elles amb esperança $p$ . És a dir, si $X_{1},\ldots ,X_{n}$ són variables aleatòries iguals (i independents) de Bernoulli amb paràmetre $p$ , aleshores $X=X_{1}+\cdots +X_{n}$ i, atès que $E[X_{i}]=p\cdot 1+q\cdot 0=p,\ i=1,\dots ,n,$ tindrem que $\operatorname {E} [X]=\operatorname {E} [X_{1}+\cdots +X_{n}]=\operatorname {E} [X_{1}]+\cdots +\operatorname {E} [X_{n}]=p+\cdots +p=np.$ D'altra banda, per a una variable de Bernoulli, $E[X_{i}^{2}]=p\cdot 1^{2}+q\cdot 0^{2}=p,$ d'on ${\text{Var}}(X_{i})=p-p^{2}=p(1-p),\ i=1,\dots ,n.$ Llavors, de la independència de $X_{1},\dots ,X_{n}$ , es dedueix que

{\text{Var}}[X]=np(1-p).

Funció de probabilitat

Sigui $X$ una variable aleatòria binomial de paràmetres $n$ i $p$ . Aleshores la probabilitat d'obtenir exactament $k\,\!$ èxits en $n\,\!$ repeticions (proves) independents de Bernouilli és:

$P(X=k)={n \choose k}p^{k}(1-p)^{n-k},\ k=0,1,\dots ,n.$ on $\!{n \choose k}={\frac {n!}{k!(n-k)!}}\,\!$ és el coeficient binomial.

Així, la funció de probabilitat de $X$ és $f(k)={n \choose k}p^{k}(1-p)^{n-k},\ k=0,1,\dots ,n.$

Funció de distribució

F(x)=\Pr(X\leq x)={\begin{cases}0,&{\text{si}}\,x<0,\\\displaystyle {\sum _{i=0}^{\lfloor x\rfloor }{n \choose i}p^{i}(1-p)^{n-i}},&{\text{si}}\,x\in [0,n],\\1,&{\text{si}}\,x>n.\end{cases}}

on $[x]$ denota la part entera de $x$ .

Fites de les cues

Per k ≤ np, es poden derivar fites superiors per la cua inferior de la funció de distribució acumulada $F(k;n,p)=\Pr(X\leq k)$ , la probabilitat que hi hagi com a màxim k successos. Com que $\Pr(X\geq k)=F(n-k;n,1-p)$ , també es poden interpretar aquestes fites per a la cua superior de la funció de distribució per k ≥ np.

La desigualtat de Hoeffding dóna la fita simple

F(k;n,p)\leq \exp \left(-2n\left(p-{\frac {k}{n}}\right)^{2}\right),\!

que no és, tanmateix, gaire forta. En particular, quan p = 1, s'obté F(k;n,p) = 0 (per a k i n fixes amb k < n), però la fita de Hoeffding dóna una constant positiva.

S'obté una fita més exacta mitjançant la fita de Chernoff:^[4]

F(k;n,p)\leq \exp \left(-nD\left({\frac {k}{n}}\parallel p\right)\right)

on D(a || p) és l'entropia relativa (o divergència Kullback-Leibler) entre una moneda-ai una moneda-p (és a dir entre Bernoulli(a) i Bernoulli(p) distribution):

D(a\parallel p)=(a)\log {\frac {a}{p}}+(1-a)\log {\frac {1-a}{1-p}}.\!

Asimptòticament, aquesta fita és raonablement exacta; vegi's ^[4] per més detalls.

També es poden obtenir fites inferiors de la cua $F(k;n,p)$ , conegudes com fites anti-concentració. Aproximant el coeficient binomial amb l'aproximació de Stirling es pot demostrar que^[5]

F(k;n,p)\geq {\frac {1}{\sqrt {8n{\tfrac {k}{n}}(1-{\tfrac {k}{n}})}}}\exp \left(-nD\left({\frac {k}{n}}\parallel p\right)\right),

que implica la fita més simple però menys exacta:

F(k;n,p)\geq {\frac {1}{\sqrt {2n}}}\exp \left(-nD\left({\frac {k}{n}}\parallel p\right)\right).

Per p = 1/2 i k ≥ 3n/8 amb n parell, es pot fer que el denominador sigui constant:^[6]

F(k;n,{\tfrac {1}{2}})\geq {\frac {1}{15}}\exp \left(-16n\left({\frac {1}{2}}-{\frac {k}{n}}\right)^{2}\right).\!

Exemple

Suposem que tenim una moneda trucada amb probabilitat 0.3 que surti cara. La probabilitat que surtin 4 cares en 6 llançaments és

f(4)={\binom {6}{4}}0.3^{4}(1-0.3)^{6-4}=0.059535.

Aproximació de la distribució binomial per les distribucions de Poisson i normal

Si $n$ tendeix a infinit i $p_{n}\,\!$ és tal que $\lim _{n\to \infty }n\,p_{n}=\lambda$ , llavors la distribució d'una variable aleatòria binomial de paràmetres $n$ i $p_{n}$ tendeix a una distribució de Poisson de paràmetre $\lambda$ .

D'altra banda, pel teorema central del límit, quan n és gran (normalment s'exigeix que $n\geq 30$ ) la distribució binomial es pot aproximar mitjançant la distribució normal.

Distribucions relacionades

Suma de binomials

Si $X ~ B(n, p)$ i $Y ~ B(m, p)$ són variables binomials independents amb la mateixa probabilitat $p$ , llavors $X + Y$ és també una variable binomial; la seva distribució és $Z = X \+ Y ~ B(n + m, p)$ :^[7]

{\begin{aligned}\operatorname {P} (Z=k)&=\sum _{i=0}^{k}\left[{\binom {n}{i}}p^{i}(1-p)^{n-i}\right]\left[{\binom {m}{k-i}}p^{k-i}(1-p)^{m-k+i}\right]\\&={\binom {n+m}{k}}p^{k}(1-p)^{n+m-k}\end{aligned}}

Es pot considerar una variable aleatòria distribuïda de forma binomial $X ~ B(n, p)$ com la suma de $n$ variables aleatòries distribuïdes segons Bernoulli. Així doncs, la suma de les variables aleatòries binomials $X ~ B(n, p)$ i $Y ~ B(m, p)$ és equivalent a la suma de $n + m$ variables aleatòries de Bernoulli, és a dir $Z = X + Y ~ B(n + m, p)$ . També es pot demostrar això directament utilitzant la regla de la suma.

No obstant això, si $X$ i $Y$ no tenen la mateixa probabilitat $p$ , llavors la variància de la suma serà més petita que la variància de la variable binomial distribuïda com $B(n + m, p)$ .

Distribució binomial de Poisson

La distribució binomial és un cas particular de la distribució binomial de Poisson, que és la distribució de una suma de $n$ assajos de Bernoulli independents i no idèntics $B(p i)$ .^[8]

Ràtio de dues distribucions binomials

Aquest resultat va ser derivat per primer cop per Katz i coautors l'any 1978.^[9]

Siguin X ~ B(n, p₁) i Y ~ B(m, p₂) independents. Sigui T = (X/n) / (Y/m).

Llavors log(T) està distribuït aproximadament de forma normal amb mitjana log(p₁/p₂) i variància ((1/p₁) − 1)/n + ((1/p₂) − 1)/m.

Distribució de Bernoulli

La distribució de Bernoulli és un cas particular de la distribució binomial, amb $n = 1$ . Simbòlicament, $X ~ B(1, p)$ té el mateix significat que $X ~ Bernoulli(p)$ . En canvi, la distribució binomial, $B(n, p)$ , és la distribució de la suma de $n$ assajos de Bernoulli independents, $Bernoulli(p)$ , cadascun amb la mateixa probabilitat $p$ .^[10]

Aproximació de Poisson

La distribució binomial convergeix a la distribució de Poisson a mesura que el nombre d'assajos tendeix a infinit mentre que el producte $np$ convergeix a un límit finit. Per tant, es pot utilitzar una distirbució de Poisson amb paràmetre $λ = np$ per aproximar $B(n, p)$ de la distribució binomial si $n$ és prou gran i $p$ és prou petit. Segons la regla del polze, aquesta aproximació és bona si $n \geq 20$ i $p \leq 0.05$ ^[11] tal que $np \leq 1$ , o si $n > 50$ i $p < 0.1$ tal que $np < 5$ ,^[12] o si $n \geq 100$ i $np \leq 10$ .^[13]^[14]

Sobre la precisió de l'aproximació de Poisson, vegi's Novak,^[15] capítol 4, i les referències que s'hi citen.

Propietats reproductives

Donades m variables binomials independents $X_{i}$ , i = 1, ..., m, de paràmetres $n_{i}$ i $p_{i}$ , respectivament, la seva suma S és també una variable binomial, de paràmetres $n_{1}+\cdots +n_{m}$ i $p$ , és a dir,

S=\sum _{i=1}^{m}X_{i}\sim B\left(\sum _{i=1}^{m}n_{i},p\right).

Referències

↑ Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statistica & Probability Letters. 23 21-25.
↑ Westland, J. Christopher. Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer, 2020, p. 53. ISBN 978-3-030-49091-1.
↑ Cervigon, Francesc La-Roca. Estadística aplicada a les ciències socials. Universitat de València, 2011-11-28, p. 191. ISBN 978-84-370-8650-7.
↑ ^4,0 ^4,1 Arratia, R.; Gordon, L. «Tutorial on large deviations for the binomial distribution». Bulletin of Mathematical Biology, vol. 51, 1, 1989, pàg. 125–131. DOI: 10.1007/BF02458840. PMID: 2706397.
↑ Robert B. Ash. Information Theory. Dover Publications, 1990, p. 115. ISBN 9780486665214.
↑ Matoušek, J.; Vondrak, J. «The Probabilistic Method». lecture notes. Arxivat de l'original el 2022-10-09.
↑ Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P. [et al.].. A Modern Introduction of Probability and Statistics. 1. Springer-Verlag London, 2005. ISBN 978-1-84628-168-6.
↑ Wang, Y. H. «On the number of successes in independent trials». Statistica Sinica, vol. 3, 2, 1993, pàg. 295–312.
↑ Katz, D.; Baptista, J.; Azen, S. P.; Pike, M. C. «Obtaining confidence intervals for the risk ratio in cohort studies». Biometrics, vol. 34, 3, 1978, pàg. 469–474. DOI: 10.2307/2530610. JSTOR: 2530610.
↑ Taboga, Marco. «Lectures on Probability Theory and Mathematical Statistics». statlect.com. [Consulta: 18 desembre 2017].
↑ «12.4 – Approximating the Binomial Distribution | STAT 414», 28-03-2023. Arxivat de l'original el 2023-03-28. [Consulta: 8 octubre 2023].
↑ Chen, Zac. H2 mathematics handbook. 1. Singapore: Educational publishing house, 2011, p. 348. ISBN 9789814288484.
↑ NIST/SEMATECH, "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods.
↑ «The Connection Between the Poisson and Binomial Distributions», 13-03-2023. Arxivat de l'original el 2023-03-13. [Consulta: 8 octubre 2023].
↑ Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746.

Vegeu també

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Distribució binomial

[1] Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statistica & Probability Letters. 23 21-25.

[2] Westland, J. Christopher. Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer, 2020, p. 53. ISBN 978-3-030-49091-1.

[3] Cervigon, Francesc La-Roca. Estadística aplicada a les ciències socials. Universitat de València, 2011-11-28, p. 191. ISBN 978-84-370-8650-7.

[ag-4] 4,0 ^4,1 Arratia, R.; Gordon, L. «Tutorial on large deviations for the binomial distribution». Bulletin of Mathematical Biology, vol. 51, 1, 1989, pàg. 125–131. DOI: 10.1007/BF02458840. PMID: 2706397.

[5] Robert B. Ash. Information Theory. Dover Publications, 1990, p. 115. ISBN 9780486665214.

[6] Matoušek, J.; Vondrak, J. «The Probabilistic Method». lecture notes. Arxivat de l'original el 2022-10-09.

[7] Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P. [et al.].. A Modern Introduction of Probability and Statistics. 1. Springer-Verlag London, 2005. ISBN 978-1-84628-168-6.

[8] Wang, Y. H. «On the number of successes in independent trials». Statistica Sinica, vol. 3, 2, 1993, pàg. 295–312.

[Katz1978-9] Katz, D.; Baptista, J.; Azen, S. P.; Pike, M. C. «Obtaining confidence intervals for the risk ratio in cohort studies». Biometrics, vol. 34, 3, 1978, pàg. 469–474. DOI: 10.2307/2530610. JSTOR: 2530610.

[10] Taboga, Marco. «Lectures on Probability Theory and Mathematical Statistics». statlect.com. [Consulta: 18 desembre 2017].

[11] «12.4 – Approximating the Binomial Distribution | STAT 414», 28-03-2023. Arxivat de l'original el 2023-03-28. [Consulta: 8 octubre 2023].

[12] Chen, Zac. H2 mathematics handbook. 1. Singapore: Educational publishing house, 2011, p. 348. ISBN 9789814288484.

[nist-13] NIST/SEMATECH, "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods.

[14] «The Connection Between the Poisson and Binomial Distributions», 13-03-2023. Arxivat de l'original el 2023-03-13. [Consulta: 8 octubre 2023].

[15] Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

Distribucions de probabilitat
Llista
Distribucions discretes amb suport finit	Benford Bernoulli Beta-binomial Binomial Binomial de Poisson Categòrica Hipergeomètrica Rademacher Uniforme discreta Zipf Zipf-Mandelbrot
Distribucions discretes amb suport infinit	Beta-binomial negativa Binomial negativa estesa Borel Conway-Maxwell-Poisson Delaporte Tipus fase Fractal parabòlica Gauss-Kuzmin Geomètrica Logarítmica Poisson mixta Skellam Yule-Simon Zeta
Distribucions contínues suportades sobre un interval acotat	Arcsinus ARGUS Balding-Nichols Bates Beta no central rectangular Cosinus elevat Irwin-Hall Kumaraswamy Logit-normal Parabòlica PERT Recíproca Triangular Uniforme Wigner
Distribucions contínues suportades sobre un interval semi-infinit	Benini Benktander Beta prima Burr χ χ2 inversa inversa escalada no central Dagum Davis Erlang Exponencial Exponencial-logarítmic F no central Flory-Schulz Fréchet Gamma Gamma/Gompertz Gamma inversa Gaussiana inversa Gaussiana inversa generalitzada Gompertz Gompertz desplaçada Gumbel de tipus II hiper-Erlang Hiperexponencial Hipoexponencial Kolmogórov-Smirnov Lambda de Wilks Lévy Log-Cauchy Log-Laplace Log-logística Log-normal Lomax Matriu exponencial Maxwell-Boltzmann Maxwell-Jüttner Mig-logística Mittag-Leffler Nakagami Normal plegada Normal truncada Pareto Poly-Weibull Rayleigh Relativista de Breit-Wigner Rice Seminormal T² de Hotelling Tipus fase Weibull Discreta de Weibull
Distribucions contínues suportades en tota la recta real	Asimètrica de Laplace Cauchy Estable Geomètrica estable Gumbel Gumbel de tipus I Hiperbòlica generalitzada Hiperbòlica secant Holtsmark Landau Laplace Logística Normal generalitzada Normalinversa de Skew Q gaussiana S_U de Johnson Slash t no central t de Student Tracy-Widom Variància-gamma Voigt Z de Fisher
Distribucions contínues amb el suport de varis tipus	Lambda de Tukey Log-logística desplaçada Marchenko-Pastur Pareto generalitzada q gaussiana q exponencial q de Weibull Valor extrem generalitzada
Barreja de distribució variable-contínua	Rectificada gaussiana
Distribució conjunta	Discreta Ewens Multinomial Multinomial de Dirichlet Multinomial negativa Contínua Dirichlet Dirichlet generalitzada Estable multivariant Gamma normal Gamma normal inversa Normal multivariable t multivariable Matriu de valor Matriu gamma Matriu gamma inversa Matriu normal Normal de Wishart Normal de Wishart inversa t matriu Wishart Wishart inversa
Direccionals	Univariada (circular) Asimètrica de Laplace envoltada Cauchy envoltada Exponencial envoltada Lévy envoltada Normal envoltada Circular uniforme Univariada de von Mises Bivariada (esfèrica) Kent Bivariada (toroidal) Bivariada de von Mises Multivariada von Mises-Fisher Bingham
Degenerada i singular	Degenerada Delta de Dirac Singular Cantor
Famílies	Barreja Circular Composta de Poisson El·líptica Envoltada Exponencial Exponencial natural Màxima entropia Pearson Tweedie Ubicació-escala

Distribució binomial

Funció de distribució de probabilitat
Tipus	Distribució binomial de Poisson, Panjer distribution ^(en) , Distribució multinomial, distribució univariant i distribució de probabilitat discreta
Paràmetres	$n\geq 0$ nombre d'assaigs (sencer) $0\leq p\leq 1$ probabilitat d'èxit (real)
Suport	$k\in \{0,\dots ,n\}\!$
FD	$I_{1-p}(n-\lfloor k\rfloor ,1+\lfloor k\rfloor )\!$
Esperança matemàtica	$np\!$
Mediana	$\lfloor np\rfloor$ o $\lceil np\rceil$ ^[1]
Moda	$\lfloor (n+1)\,p\rfloor \!$ o $\lceil (n+1)\,p\rceil -1\!$
Variància	$np(1-p)\!$
Coeficient de simetria	${\frac {1-2p}{\sqrt {np(1-p)}}}\!$
Curtosi	${\frac {1-6p(1-p)}{np(1-p)}}\!$
Entropia	${\frac {1}{2}}\ln \left(2\pi Nep(1-p)\right)+O\left({\frac {1}{n}}\right)$
FGM	$\left(p\left(\mathrm {e} ^{t}-1\right)+1\right)^{n}$
FC	$(1-p+pe^{it})^{n}\!$
Mathworld	BinomialDistribution