Vés al contingut

Model amb excés de zeros

De la Viquipèdia, l'enciclopèdia lliure
Histogrames de 4 distribucions de Poisson inflades zero (ZIP) amb una mitjana de 5 o 10 i una proporció d'inflació zero de 0,2 o 0,5.

En estadística, un model amb excés de zeros és un model estadístic basat en una distribució de probabilitat inflada de zeros, és a dir, una distribució que permet fer observacions freqüents de valor zero.

Els models zero-inflats s'utilitzen habitualment en l'anàlisi de dades de recompte, com ara el nombre de visites que fa un pacient a la sala d'urgències en un any o el nombre de peixos capturats en un dia en un llac.[1] Les dades de recompte poden prendre valors de 0, 1, 2, … (valors enters no negatius).[2] Altres exemples de dades de recompte són el nombre d'èxits registrats per un comptador Geiger en un minut, els dies de pacients a l'hospital, els gols marcats en un partit de futbol [3] i el nombre d'episodis d'hipoglucèmia per any per a un pacient amb diabetis.[4]

Per a l'anàlisi estadística, la distribució dels recomptes sovint es representa mitjançant una distribució de Poisson o una distribució binomial negativa. Hilbe[5] assenyala que "la regressió de Poisson es concep tradicionalment com el model de recompte bàsic sobre el qual es basen una varietat d'altres models de recompte". En un model de Poisson, “... la variable aleatòria és la resposta i el paràmetre del recompte (lambda) és la mitjana. Sovint, també s'anomena paràmetre de velocitat o intensitat... En la literatura estadística, també s'expressa com (mu) quan es refereix a Poisson i als models binomials negatius tradicionals.

En algunes dades, el nombre de zeros és més gran del que s'esperaria amb una distribució de Poisson o una distribució binomial negativa. Les dades amb un excés de zero recomptes es descriuen com a zero-inflat.[6]

Histogrames d'exemple de distribucions de Poisson inflades zero amb mitjana de 5 o 10 i proporció d'inflació zero de 0,2 o 0,5 es mostren a continuació, basats en el programa R ZeroInflPoiDistPlots. R de Bilder i Laughlin.[7]

Referències

[modifica]
  1. Bilder, Christopher & Loughin, Thomas (2015), Analysis of Categorical Data with R (First ed.), CRC Press / Chapman & Hall, ISBN 978-1439855676
  2. Hilbe, Joseph M. (2014), Modeling Count Data (First ed.), Cambridge University Press, ISBN 978-1107611252
  3. Hilbe, Joseph M. (2007), Negative Binomial Regression (Second ed.), Cambridge University Press, ISBN 978-0521198158
  4. Lachin, John M. (2011), Biostatistical Methods: The Assessment of Relative Risks (Second ed.), Wiley, ISBN 978-0470508220
  5. Hilbe, Joseph M. (2007), Negative Binomial Regression (Second ed.), Cambridge University Press, ISBN 978-0521198158
  6. Lachin, John M. (2011), Biostatistical Methods: The Assessment of Relative Risks (Second ed.), Wiley, ISBN 978-0470508220
  7. Bilder, Christopher & Loughin, Thomas (2015), Analysis of Categorical Data with R (First ed.), CRC Press / Chapman & Hall, ISBN 978-1439855676