Distribució binomial
Funció de distribució de probabilitat | |
Tipus | Distribució binomial de Poisson, Panjer distribution (en) , Distribució multinomial, distribució univariant i distribució de probabilitat discreta |
---|---|
Paràmetres | nombre d'assaigs (sencer) probabilitat d'èxit (real) |
Suport | |
FD | |
Esperança matemàtica | |
Mediana | o [1] |
Moda | o |
Variància | |
Coeficient de simetria | |
Curtosi | |
Entropia | |
FGM | |
FC | |
Mathworld | BinomialDistribution |
En Teoria de la probabilitat i en estadística, una variable aleatòria es diu que té una distribució binomial de paràmetres i si representa el nombre d'èxits en repeticions independents d'una prova que té probabilitat d'èxit . Per exemple, tirem 10 vegades un dau ordinari i comptem quantes vegades surt un 6; en aquest cas l'èxit és "treure un 6", i la variable que compta el nombre de sisos té una distribució binomial de paràmetres i .
La distribució binomial és la base de la popular prova binomial de significació estadística.[2]
Va ser proposada pel matemàtic i físic suís Jacob Bernoulli.[3]
Distribució de Bernoulli
[modifica]Les distribucions binomials s'inscriuen en el marc de referència de les distribucions de Bernoulli. S'anomena experiència de Bernoulli aquell experiment aleatori del qual només s'estudia la verificació o no d'un esdeveniment que pot donar-se amb probabilitat La realització de l'esdeveniment s'anomena èxit. S'acostuma a representar la probabilitat del complementari (no ), la realització del qual s'anomena fracàs, per és clar que
Així, un experiment o experiència de Bernoulli es caracteritza per ser dicotòmic, és a dir, només són possibles dos resultats: èxit o fracàs.
Exemples d'experiències de Bernoulli
- Es llança una moneda, l'esdeveniment A podria ser "que surti cara".
- En una bossa hi ha boles blanques, negres i vermelles. traiem una bola i mirem si és de color blanc o no. L'esdeveniment A podria ser "treure bola blanca".
- En un referèndum amb possibles respostes Sí o No, l'esdeveniment A podria ser "que surti Sí".
Distribució binomial
[modifica]La distribució binomial és una distribució de probabilitat discreta que fa el recompte del nombre de vegades que es verifica l'èxit (realització de l'esdeveniment ) quan es repeteix vegades, de forma independent i en les mateixes condicions, una experiència de Bernouilli.
Per n = 1, la distribució binomial és una distribució de Bernoulli.
Designem per X la variable aleatòria que mesura el nombre d'èxits que s'han produït en els n experiments. Per indicar que segueix una distribució binomial de paràmetres n i p , s'escriu:
Exemples
[modifica]Les següents situacions són exemples d'experiments que poden modelitzar per aquesta distribució:
- Es llança un dau deu vegades i es compta el nombre de sisos obtinguts: X ~ B(10, 1/6)
- Es llança una moneda dues vegades i es compta el nombre de cares obtingudes, tenim
- Una partícula es mou unidimensionalment amb probabilitat de moure's una unitat de distància cap enrere i de moure's una unitat cap endavant. Després de moviments, el nombre de vegades que s'ha mogut cap endavant és una variable binomial .
Propietats característiques
[modifica]Mitjana i Variància
[modifica]Sigui una variable aleatòria binomial de paràmetres i .
Això es dedueix per la linealitat de l'esperança, ja que X és la suma de n variables aleatòries de Bernoulli idèntiques, cadascuna d'elles amb esperança p. És a dir, si són variables aleatòries iguals (i independents) de Bernoulli amb paràmetre p, aleshores i, atès que tindrem que D'altra banda, per a una variable de Bernoulli, d'on Llavors, de la independència de , es dedueix que
Funció de probabilitat
[modifica]Sigui una variable aleatòria binomial de paràmetres i . Aleshores la probabilitat d'obtenir exactament èxits en repeticions (proves) independents de Bernouilli és:
on és el coeficient binomial.
Així, la funció de probabilitat de és
Funció de distribució
[modifica]
on denota la part entera de .
Fites de les cues
[modifica]Per k ≤ np, es poden derivar fites superiors per la cua inferior de la funció de distribució acumulada , la probabilitat que hi hagi com a màxim k successos. Com que , també es poden interpretar aquestes fites per a la cua superior de la funció de distribució per k ≥ np.
La desigualtat de Hoeffding dóna la fita simple
que no és, tanmateix, gaire forta. En particular, quan p = 1, s'obté F(k;n,p) = 0 (per a k i n fixes amb k < n), però la fita de Hoeffding dóna una constant positiva.
S'obté una fita més exacta mitjançant la fita de Chernoff:[4]
on D(a || p) és l'entropia relativa (o divergència Kullback-Leibler) entre una moneda-ai una moneda-p (és a dir entre Bernoulli(a) i Bernoulli(p) distribution):
Asimptòticament, aquesta fita és raonablement exacta; vegi's [4] per més detalls.
També es poden obtenir fites inferiors de la cua , conegudes com fites anti-concentració. Aproximant el coeficient binomial amb l'aproximació de Stirling es pot demostrar que[5]
que implica la fita més simple però menys exacta:
Per p = 1/2 i k ≥ 3n/8 amb n parell, es pot fer que el denominador sigui constant:[6]
Exemple
[modifica]Suposem que tenim una moneda trucada amb probabilitat 0.3 que surti cara. La probabilitat que surtin 4 cares en 6 llançaments és
Aproximació de la distribució binomial per les distribucions de Poisson i normal
[modifica]Si tendeix a infinit i és tal que , llavors la distribució d'una variable aleatòria binomial de paràmetres i tendeix a una distribució de Poisson de paràmetre .
D'altra banda, pel teorema central del límit, quan n és gran (normalment s'exigeix que ) la distribució binomial es pot aproximar mitjançant la distribució normal.
Distribucions relacionades
[modifica]Suma de binomials
[modifica]Si X ~ B(n, p) i Y ~ B(m, p) són variables binomials independents amb la mateixa probabilitat p, llavors X + Y és també una variable binomial; la seva distribució és Z = X \+ Y ~ B(n + m, p):[7]
Es pot considerar una variable aleatòria distribuïda de forma binomial X ~ B(n, p) com la suma de n variables aleatòries distribuïdes segons Bernoulli. Així doncs, la suma de les variables aleatòries binomials X ~ B(n, p) i Y ~ B(m, p) és equivalent a la suma de n + m variables aleatòries de Bernoulli, és a dir Z = X + Y ~ B(n + m, p). També es pot demostrar això directament utilitzant la regla de la suma.
No obstant això, si X i Y no tenen la mateixa probabilitat p, llavors la variància de la suma serà més petita que la variància de la variable binomial distribuïda com B(n + m, p).
Distribució binomial de Poisson
[modifica]La distribució binomial és un cas particular de la distribució binomial de Poisson, que és la distribució de una suma de n assajos de Bernoulli independents i no idèntics B(pi).[8]
Ràtio de dues distribucions binomials
[modifica]Aquest resultat va ser derivat per primer cop per Katz i coautors l'any 1978.[9]
Siguin X ~ B(n, p1) i Y ~ B(m, p2) independents. Sigui T = (X/n) / (Y/m).
Llavors log(T) està distribuït aproximadament de forma normal amb mitjana log(p1/p2) i variància ((1/p1) − 1)/n + ((1/p2) − 1)/m.
Distribució de Bernoulli
[modifica]La distribució de Bernoulli és un cas particular de la distribució binomial, amb n = 1. Simbòlicament, X ~ B(1, p) té el mateix significat que X ~ Bernoulli(p). En canvi, la distribució binomial, B(n, p), és la distribució de la suma de n assajos de Bernoulli independents, Bernoulli(p), cadascun amb la mateixa probabilitat p.[10]
Aproximació de Poisson
[modifica]La distribució binomial convergeix a la distribució de Poisson a mesura que el nombre d'assajos tendeix a infinit mentre que el producte np convergeix a un límit finit. Per tant, es pot utilitzar una distirbució de Poisson amb paràmetre λ = np per aproximar B(n, p) de la distribució binomial si n és prou gran i p és prou petit. Segons la regla del polze, aquesta aproximació és bona si n ≥ 20 i p ≤ 0.05[11] tal que np ≤ 1, o si n > 50 i p < 0.1 tal que np < 5,[12] o si n ≥ 100 i np ≤ 10.[13][14]
Sobre la precisió de l'aproximació de Poisson, vegi's Novak,[15] capítol 4, i les referències que s'hi citen.
Propietats reproductives
[modifica]Donades m variables binomials independents , i = 1, ..., m, de paràmetres i , respectivament, la seva suma S és també una variable binomial, de paràmetres i , és a dir,
Referències
[modifica]- ↑ Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statistica & Probability Letters. 23 21-25.
- ↑ Westland, J. Christopher. Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer, 2020, p. 53. ISBN 978-3-030-49091-1.
- ↑ Cervigon, Francesc La-Roca. Estadística aplicada a les ciències socials. Universitat de València, 2011-11-28, p. 191. ISBN 978-84-370-8650-7.
- ↑ 4,0 4,1 Arratia, R.; Gordon, L. «Tutorial on large deviations for the binomial distribution». Bulletin of Mathematical Biology, vol. 51, 1, 1989, pàg. 125–131. DOI: 10.1007/BF02458840. PMID: 2706397.
- ↑ Robert B. Ash. Information Theory. Dover Publications, 1990, p. 115. ISBN 9780486665214.
- ↑ Matoušek, J.; Vondrak, J. «The Probabilistic Method». lecture notes. Arxivat de l'original el 2022-10-09.
- ↑ Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P. [et al.].. A Modern Introduction of Probability and Statistics. 1. Springer-Verlag London, 2005. ISBN 978-1-84628-168-6.
- ↑ Wang, Y. H. «On the number of successes in independent trials». Statistica Sinica, vol. 3, 2, 1993, pàg. 295–312.
- ↑ Katz, D.; Baptista, J.; Azen, S. P.; Pike, M. C. «Obtaining confidence intervals for the risk ratio in cohort studies». Biometrics, vol. 34, 3, 1978, pàg. 469–474. DOI: 10.2307/2530610. JSTOR: 2530610.
- ↑ Taboga, Marco. «Lectures on Probability Theory and Mathematical Statistics». statlect.com. [Consulta: 18 desembre 2017].
- ↑ «12.4 – Approximating the Binomial Distribution | STAT 414», 28-03-2023. Arxivat de l'original el 2023-03-28. [Consulta: 8 octubre 2023].
- ↑ Chen, Zac. H2 mathematics handbook. 1. Singapore: Educational publishing house, 2011, p. 348. ISBN 9789814288484.
- ↑ NIST/SEMATECH, "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods.
- ↑ «The Connection Between the Poisson and Binomial Distributions», 13-03-2023. Arxivat de l'original el 2023-03-13. [Consulta: 8 octubre 2023].
- ↑ Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746.