Usuari:Freutci/generatriu
En Teoria de la probabilitat i Estadística, la distribució uniforme discreta és una distribució de probabilitat sobre un conjunt finit que dóna la mateixa probabilitat a cadascun dels elements del conjunt. Correspon a la definició de Laplace de probabilitat en un experiment aleatori equiprobable (igual probabilitat) i és un model matemàtic de l'expressió "escollir a l'atzar".
Un exemple senzill és el resultat del llançament d'un dau. Els valors possibles són 1, 2, 3, 4, 5, 6, i cada vegada que es llança el dau la probabilitat d'una puntuació determinada és 1/6. Si es llancen dos daus i es sumen els seus valors, la distribució resultant ja no és uniforme perquè no totes les sumes tenen la mateixa probabilitat.
En aquest article ens centrarem en la distribució uniforme discreta en el context de les variables aleatòries, és a dir, on el conjunt de referència és un conjunt finit de nombres reals, però també es consideren distribucions uniformes discretes sobre altres tipus de conjunts. Per exemple, una permutació aleatòria és una permutació generada de manera uniforme a partir de les permutacions d'una longitud determinada, i un arbre allargant uniforme és un arbre d'expansió generat uniformement entre els arbres d'expansió d'un gràfic donat.[1][2]
Definició
[modifica]Es diu que una variable aleatòria té una distribució uniforme discreta o distribució rectangular discreta [3] [4] sobre el conjunt si Escriurem
L'esperança de ésEn general, el moment d'ordre ésLa variància ésLa funció generatriu de moments és La funció característica és
Distribució uniforme sobre un conjunt de nombres enters consecutius
[modifica]Distribució uniforme sobre el conjunt {1,2,...,n}
[modifica]Començarem estudiant el cas i després veurem un cas més general. La funció de distribució és
Es pot escriure de forma compacta on és la part entera de .
Per la fórmula de la suma d'una progressió aritmètica, Anàlogament, per la fórmula de la suma dels quadrats dels primers nombres naturals, Llavors, A partir de la fórmula de la suma d'una progressió geomètrica deduïm que la funció generatriu de probabilitats és D'aquí, la funció generatriu de moments és La funció característica val Aquesta distribució és una distribució simètrica.
Cas general
[modifica]Considerem dos nombres enters , i sigui [5]. Sigui el nombre d'elements del conjunt . Llavors,
L'esperança de és La variància ésLa funció generatriu de probabilitats és i la funció generatriu de moments Aquestes propietats poden demostrar-se directament o bé utilitzant que si aleshores Així, per exemple, la funció generatriu de probabilitats es pot deduir de la següent manera:
Aquesta distribució també és una distribució simètrica.
Extensió: Distribució uniforme sobre un conjunt de punts equidistants
[modifica]Johnson et al. [6] consideren la següent situació: fixem dos números , , i sigui , i consideren la distribució uniforme sobre el conjunt ; notem que aquest conjunt té punts.
Suma de variables uniformes discretes independents
[modifica]Exemple. Tal com s'ha comentat a la introducció, la suma dels resultats de dos daus no segueix una distribució uniforme. Concretament, si designem per el resultat del primer dau i per el resultat del segon dau, que òbviament són independents, i designem per la seva suma, veiem que i Anàlogament, es completa la taula
2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
El problema de De Moivre. Siguin variables aleatòries independents, totes amb distribució uniforme discreta en el conjunt . Volem estudiar la distribució de la suma Aquest problema va ser resolt amb tota generalitat per De Moivre [7] (Feller [8]) mitjançant funcions generatrius de probabilitat: per a on També es demostra que per a , Vegeu Funció generatriu de probabilitat per a la demostració.
Un dels exemples que dóna De Moivre és el següent: tirem 6 daus ordinaris 6 vegades això és, . Llavors, la probabilitat d'obtenir una suma de 15 punts és
Un altre exemple.
Del resultat anterior es dedueix que la suma de distribucions uniformes independents amb el mateix suport no té distribució uniforme. En aquest exemple veurem que la suma de distribucions uniformes independents amb diferent suport pot donar una distribució uniforme.
Considerem dos daus de 10 cares cadascun, el primer numerat amb les desenes 00, 10, 20, ... 90 i l'altre amb les unitats 0,1,...,9. Llavors la suma dels resultats segueix una llei de l'uniforme discreta amb suport els números de 0 al 99 i equival a tirar un dau de 100 cares numerat del 0 al 99. Formalment, si és el resultat del dau en desenes i el resultat del dau en unitats, les funcions generatrius de probabilitat són i Per la independència dels dos daus,D'on resulta que .
Estimació dels paràmetres
[modifica]La família de distribucions uniformes en un conjunt d'enters consecutius (amb un o ambdós límits desconeguts) té un estadístic suficient de dimensió finita, concretament, el triple del màxim de la mostra, el mínim de la mostra i la mida de la mostra, però no és una família exponencial de distribucions, perquè el suport varia amb els paràmetres. Per a les famílies el suport de les quals no depèn dels paràmetres, el teorema de Pitman–Koopman–Darmois estableix que només les famílies exponencials tenen un estadístic suficient amb dimensió afitada quan augmenta la mida de la mostra. La distribució uniforme és, per tant, un exemple senzill que mostra la necessitat de les hipòtesis d'aquest teorema.
Estimació de la mida d'una població seriada
[modifica]Aquesta secció es basa en [9] [10]. Tenim una població numerada de l'1 al : per exemple, els taxis d'una ciutat que tenen un número de registre o uns objectes produïts per una fàbrica que tenen un número de sèrie. El número és desconegut i volem estimar-lo a partir de l'observació del número de registre de elements; específicament tenim observacions ; donat el context (vegeu més endavant el problema dels tancs alemanys) suposarem que fem el mostreig sense reposició: Prenem un element amb distribució uniforme sobre , anotem el número i el deixem fora, i llavors prenem un altre element, amb distribució uniforme entre els que queden, anotem el número i també el deixem fora, i així successivament. Cal tenir present que les variables aleatòries no són independents. Aquest problema es coneix com el problema dels tancs alemanys, o com el del número de taxis [11] (no confondre amb el número del taxi de Ramanujan) o Anàlisi de números seriats.
L'estimador de que primer ve al cap és prendre el número més gran que ha sortit:De fet, és l'estimador del màxim de versemblança. Però és clar que aquest número sub-estima ; en altres paraules, té biaix. Per corregir el biaix, calculem la seva esperança: que és clar que és menor que ja que quan . Però l'estimador és un estimador sense biaix de . A més, és un estadístic suficient i pel Teorema de Raó-Blackwell [12] és l'estimador sense biaix de mínima variància. La variància és
Problema dels tancs alemany
[modifica]Durant la Segona guerra mundial, el aliats volien estimar el número de tancs que fabricaven els alemanys [13]. Segons les estimacions dels serveis d'inteligència, els alemanys estaven produint entorn de 1.400 tancs per mes entre juny de 1940 i setembre de 1942, però els serveis d'Estadistica, aplicant fórmules similars a les anteriors, utilitzant els números de sèrie dels tancs alemanys capturats (tant aquells que encara estiguessin en estat de ser utilitzats com aquells parcialment destruïts), el número resultant es va calcular en 256 al mes. Després de la guerra, les xifres de producció oficials, obtingudes de documents confiscats en el Ministeri de la Guerra d'Albert Speer, van mostrar que el nombre real va ser de 255.[14]
Vegeu el video [15]
on m és el major número de sèrie observat (màxim de la mostra) i k és el nombre de tancs observat (grandària de la mostra).[10][16][17][18][19]
Dades específiques
S'han citat les següents estimacions per a alguns mesos específics:[20]
Mes | Estimació estadística | Estimació d'intel·ligència | Registre alemany |
Juny de 1940 | 169 | 1000 | 122 |
Juny de 1941 | 244 | 1550 | 271 |
Agost de 1942 | 327 | 1550 | 342 |
Contramesures
[modifica]Per a confondre l'anàlisi dels números de sèrie, es poden excloure els números de sèrie o reduir la informació auxiliar utilitzable. Alternativament, es poden utilitzar números de sèrie que resisteixin la criptoanàlisi, de forma més efectiva triant números aleatòriament sense reemplaçament d'una llista que sigui molt major que el nombre d'objectes produïts, o produint números aleatoris i comprovant-los amb la llista de números ja assignats; és probable que es produeixin col·lisions tret que el nombre de dígits possibles sigui més del doble del nombre de dígits en el nombre d'objectes produïts (on el número de sèrie pot estar en qualsevol base); vegeu problema de l'aniversari.[nota 1] Per a això, es pot utilitzar un generador de números pseudoaleatoris criptogràficament segur. Tots aquests mètodes requereixen una taula de cerca (o trencar el xifrat) per a passar del número de sèrie a l'ordre de producció, la qual cosa complica l'ús dels números de sèrie: per exemple, no es pot recuperar un rang de números de sèrie, sinó que cal buscar cadascun per separat o generar una llista.
Alternativament, es poden encriptar els números de sèrie seqüencials mitjançant un xifrat per substitució simple, que permet una fàcil descodificació, però que també és fàcilment deduïble mitjançant anàlisi de freqüències: encara quan es comenci des d'un punt arbitrari, el text sense format té un patró (és a dir, els números es troben en seqüència). Hi ha un exemple d'això en la novel·la de Ken Follett Code to Zero, on l'encriptat dels números de sèrie del coet Jupiter-C són obtinguts com:
H | O | N | T | S | V | I | L | E | X |
---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 0 |
La paraula clau aquí és Huntsville (on s'ometen les lletres repetides) el que proveeix una clau de deu lletres.[21] Per tant el coet número 13 era "HN", i el número del coet 24 era "UT".
- ↑ Monleón-Getino, Toni; Casado, Clara Rodríguez. Probabilitat i estadística per a ciències II. Edicions Universitat Barcelona, 2017-01-16, p. 25. ISBN 978-84-475-4021-1. Arxivat 2024-07-27 a Wayback Machine.
- ↑ Vázquez, Gisela Pujol; Bàguena, Josep Gibergans; Ciaurri, Fernando García. Problemes d'estadística amb aplicació a l'enginyeria. Editorial UOC, 2009. ISBN 978-84-9788-774-8. Arxivat 2024-07-27 a Wayback Machine.
- ↑ Masoliver, Jaume; Wagensberg, Jorge. Introducció a la teoria de la probabilitat i de la informació. Barcelona: Edicions Proa, Biblioteca Universitària, 1996, p. 114. ISBN 84-8256-230-4.
- ↑ Rohatgi, Vijay K.; Saleh, A. K. Md Ehsanes. An introduction to probability and statistics. Third edition, 7. Nachdruck. Hoboken, New Jersey: Wiley, 2016, p. 175. ISBN 978-1-118-79964-2.
- ↑ «Distribuciones de probabilidad». Sergas. Arxivat de l'original el 2024-04-15. [Consulta: 28 juny 2024].
- ↑ Johnson, N. L.; Kemp, A.; Kotz Univariate discrete distributions. 3rd ed. Hoboken, N.J: Wiley, 2005, p. 272. ISBN 978-0-471-27246-5.
- ↑ De Moivre, A.. The Doctrine of Chances. The Third Edition. London: Printed for A. Millar, 1756, p. 41.
- ↑ Feller, William. Introducción a la teoría de probabilidades y sus aplicaciones, Vol. 1. México: Editorial Limusa-Wiley, S. A., 1973, p. 290.
- ↑ Goodman, Leo A. «Serial Number Analysis». Journal of the American Statistical Association, 47, 260, 1952, pàg. 622–634. DOI: 10.2307/2280780. ISSN: 0162-1459.
- ↑ 10,0 10,1 Johnson, Roger W. «Estimating the Size of a Population» (en anglès). Teaching Statistics, 16, 2, 6-1994, pàg. 50–52. Arxivat de l'original el 2024-07-27. DOI: 10.1111/j.1467-9639.1994.tb00688.x. ISSN: 0141-982X [Consulta: 26 juliol 2024].
- ↑ Noether, Gottfried Emanuel. Introduction to Statistics: The Nonparametric Way. New York, NY: Springer, 1991, p. 33 i 54. ISBN 978-1-4612-6955-7.
- ↑ Casella, George; Berger, Roger L. Statistical inference. 2. ed. Pacific Grove, Calif: Duxbury, 2002, p. 343, Theorem 7.3.17. ISBN 978-0-534-24312-8.
- ↑ Ruggles, Richard; Brodie, Henry «An Empirical Approach to Economic Intelligence in World War II» (en anglès). Journal of the American Statistical Association, 42, 237, 3-1947, pàg. 72–91. Arxivat de l'original el 2018-11-06. DOI: 10.1080/01621459.1947.10501915. ISSN: 0162-1459 [Consulta: 26 juliol 2024].
- ↑ «Gavyn Davies does the maths – How a statistical formula won the war» (en anglès). The Guardian, 20-07-2006. [Consulta: 6 juliol 2014].
- ↑ Numberphile. «The Clever Way to Count Tanks - Numberphile», 31-07-2024. [Consulta: 12 desembre 2024].
- ↑ Johnson, Roger «Getting the Best from Teaching Statistics» (en anglès). Teaching Statistics, 2006. Arxivat de l'original el 2008-04-10.
- ↑ Scheaffer, Richard L. Activity-Based Statistics (en anglès). Springer, 2014-01-15, p. 148-150. ISBN 978-1-4757-3844-5. Arxivat 2024-07-27 a Wayback Machine.
- ↑ Landwehr, James M.; Swift, Jim; Watkins, Ann E. Exploring Surveys and Information from Samples (en anglès). Dale Seymour Publications, 1987, p. 75-83. ISBN 978-0-86651-339-5. Arxivat 2024-07-27 a Wayback Machine.
- ↑ Smith, Gary. Introduction to Statistical Reasoning (en anglès). WCB/McGraw-Hill, 1998, p. 148-149. ISBN 978-0-07-059276-6.
- ↑ Order Statistics, in Virtual Laboratories in Probability and Statistics
- ↑ «Rockets and Missiles» (en anglès). www.spaceline.org. Arxivat de l'original el 2024-07-27. [Consulta: 26 juliol 2024].
Error de citació: Existeixen etiquetes <ref>
pel grup «nota» però no s'ha trobat l'etiqueta <references group="nota"/>
corresponent.