Fórmula de mostreig d'Ewens
En la genètica de poblacions, la fórmula de mostreig d'Ewens descriu les probabilitats associades amb els recomptes de la quantitat d'al·lels diferents que s'observen en un nombre determinat de vegades a la mostra.
Definició
[modifica]La fórmula de mostreig d'Ewens, presentada per Warren Ewens, estableix que en determinades condicions (especificades a continuació), si una mostra aleatòria de n gàmetes es pren d'una població i es classifica segons el gen en un locus determinat, la probabilitat que hi hagi a1 al·lels representats una vegada a la mostra, i a₂ al·lels representats dues vegades, i així successivament, és
per a un nombre positiu θ que representa la taxa de mutació de la població, sempre que a1, ..., ak sigui una seqüència d'enters no negatius tal que
La frase «en determinades condicions» usada anteriorment es fa precisa amb els següents supòsits:
- La mida de la mostra n és petita en comparació amb la mida de tota la població; i
- La població està en equilibri estadístic sota la mutació i la deriva genètica, i el paper de la selecció en el locus en qüestió és insignificant; i
- Tot al·lel mutante és nou. (Vegeu també el model d'al·lels infinits).
Aquesta és una distribució de probabilitat en el conjunt de totes les particions de l'enter n. Entre els probabilistes i els estadístics, sovint es coneix com la distribució d'Ewens multivariant.
Propietats matemàtiques
[modifica]Quan θ = 0, la probabilitat que tots els n gens siguin els mateixos és 1. Quan θ = 1, llavors la distribució és precisament la de la partició entera induïda per una permutació aleatòria uniformement distribuïda. Quan θ → ∞, la probabilitat que dos n gens siguin els mateixos s'apropa a 1.
Aquesta família de distribucions de probabilitat gaudeix de la propietat que si després es prenen n de la mostra, m dels n gàmetes es trien sense reemplaçar, la distribució de probabilitat resultant en el conjunt de totes les particions del menor nombre enter m és just el que la fórmula anterior donaria si m es posa en lloc de n.
La distribució d'Ewens sorgeix naturalment del procés del restaurant xinès.
Bibliografia
[modifica]- Warren Ewens, "The sampling theory of selectively neutral alleles", Theoretical Population Biology, volume 3, pages 87–112, 1972.
- H. Crane. (2016) "The Ubiquitous Ewens Sampling Formula", Statistical Science, 31:1 (Feb 2016). This article introduces a series of seven articles about Ewens Sampling in a special issue of the journal.
- J.F.C. Kingman, "Random partitions in population genetics", Proceedings of the Royal Society of London, Series B, Mathematical and Physical Sciences, volume 361, number 1704, 1978.
- S. Tavare and W. J. Ewens, "The Multivariate Ewens distribution." (1997, Chapter 41 from the reference below).
- N.L. Johnson, S. Kotz, and N. Balakrishnan (1997) Discrete Multivariate Distributions, Wiley. ISBN 0-471-12844-9.