Usuari:Moises.gomez.mateu/proves

Aquesta és una pàgina de proves de Moises.gomez.mateu. Es troba en subpàgines de la mateixa pàgina d'usuari. Serveix per a fer proves o desar provisionalment pàgines que estan sent desenvolupades per l'usuari. No és un article enciclopèdic. També podeu crear la vostra pàgina de proves.

Vegeu Viquipèdia:Sobre les proves per a més informació, i altres subpàgines d'aquest usuari

En estadística, l'interval de confiança o error de l'estimació és un interval (un rang entre dos valors) al voltant d'un paràmetre mostral en els quals, amb una probabilitat (o nivell de confiança) determinat, se situarà el aquell paràmetre en la població.

Un paràmetre mostral del qual se sol determinar l'interval de confiança és la mitjana.

El nivell de confiança desitjat és establert per l'investigador (no és determinat per les dades). Més comunament, s'utilitza el nivell de confiança del 95%.^[1] No obstant això, es poden utilitzar altres nivells de confiança, per exemple, el 90% i el 99%.

Si $\alpha$ és l'error aleatori que es vol cometre, la probabilitat serà de 1 - $\alpha$ .

A menor nivell de confiança l'interval serà més precís, però es cometrà un major error. Per a comprendre les següents fórmules, és necessari conèixer els conceptes de variabilitat del paràmetre, error, nivell de confiança, valor crític i valor α.

Un interval de confiança és, doncs, una expressió del tipus [θ₁, θ₂] ó θ₁ ≤ θ ≤ θ₂, on θ és el paràmetre a estimar. Aquest interval conté el paràmetre estimat amb una determinada certesa o nivell de confiança 1-α.

Quan s'ofereix un interval de confiança es dóna per descomptat que les dades poblacionals es distribuïxen d'una manera determinada. És habitual que ho facin mitjançant la distribució normal. La construcció d'intervals de confiança també es pot realitzar usant la desigualtat de Txebixev.

Exemples

Interval de confiança per a la mitjana d'una població

D'una població de mitjana $\mu$ i desviació típica $\sigma$ es poden prendre mostres de $n$ elements. Cadascuna d'aquestes mostres té a la vegada una mitjana. Es pot demostrar que la mitjana de totes les mitjanes mostrals coincideix amb la mitjana poblacional:^[2] $\mu _{\bar {x}}=\mu$

Si el tamany de les mostres es suficientment gran,^[3] o la distribució poblacional és normal, la distribució de mitjanes és, prácticament, una distribució normal (o [gauss]]iana) amb mitjana μ i una desviació típica donada per la següent expressó: $\sigma _{\bar {x}}={\frac {\sigma }{\sqrt {n}}}$ . Això es representa com segueix: ${\bar {X}}\sim N(\mu ,{\frac {\sigma }{\sqrt {n}}})$ . Si estandaritzem, aleshores: ${\frac {{\bar {X}}-\mu }{\frac {\sigma }{\sqrt {n}}}}=Z\sim N(0,1)$

En una distribució Z ~ N(0, 1) pot calcular-se fàcilment un interval dins del qual caiguin un determinat percentatge d'observacions. És a dir, és facil trobar z₁ i z₂ tals que P[z₁ ≤ z ≤ z₂] = 1 - α, on (1 - α)·100 és el percentatge buscat (veure uso de las tablas en una distribución normal).

En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si solo se conoce una media muestral ( ${\bar {x}}$ ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará $1-\alpha$ (debido a que $\alpha$ es el error que se cometerá, un término opuesto).

Para ello se necesita calcular el punto $X_{\alpha /2}$ —o, mejor dicho, su versión estandarizada $Z_{\alpha /2}$ o valor crítico— junto con su "opuesto en la distribución" $X_{-\alpha /2}$ . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

center

Dicho punto es el número tal que:

$\mathbb {P} [{\bar {x}}\geq X_{\alpha /2}]=\mathbb {P} [z\geq z_{\alpha /2}]=\alpha /2$

Y en la versión estandarizada se cumple que:

$z_{-\alpha /2}=-z_{\alpha /2}$

Así:

$\mathbb {P} \left[{\bar {x}}-z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {x}}+z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}}\right]=1-\alpha$

De xxx lo cual se obtendrá el intervalo de confianza:

$({\bar {x}}-z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}},{\bar {x}}+z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}})$

Obsérvese que el intervalo de confianza viene dado por la media muestral $({\bar {x}})$ ± el producto del valor crítico $Z_{\alpha /2}$ por el error estándar $({\frac {\sigma }{\sqrt {n}}})$ .

Si no se conoce y n es grande (habitualmente se toma n ≥ 30):^[4]

Aproximaciones para el valor $z_{\alpha /2}$ para los niveles de confianza estándar son 1,96 para $1-\alpha =95\%$ y 2,576 para $1-\alpha =99\%$ .^[5]

Intervalo de confianza para una proporción

El intervalo de confianza para estimar una proporción p, conocida como una proporción muestral p_n de una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es:

$(p_{n}-z_{\alpha /2}{\sqrt {\frac {p_{n}(1-p_{n})}{n}}},\;p_{n}+z_{\alpha /2}{\sqrt {\frac {p_{n}(1-p_{n})}{n}}})$

En la demostración de estas fórmulas están involucrados el Teorema Central del Límite y la aproximación de una binomial por una normal.^[6]

Ejemplo práctico

rightUna máquina llena tazas con helado, y se supone que está ajustada para verter la cantidad de 250 g. Como la máquina no puede llenar cada taza con exactamente 250 g, el contenido que se añade a cada taza individual presenta cierta variación y se le asigna una variable aleatoria X. Se asume que esta variación se ajusta a una distribución normal de alrededor de la cantidad promedio deseada de 250 g, con una desviación estándar de 2.5 g.

Para determinar si la máquina está adecuadamente calibrada, se toma una muestra aleatoria de n = 25 tazas de helado para pesarlas. La medición resultante es X₁, ..., X₂₅, una muestra aleatoria procedente de X.

Para μ, es suficiente con dar una estimación. El estimador adecuado es la media muestral:

{\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.

La muestra señala los pesos reales x₁, ..., x₂₅, con media:

{\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{gramos}}.

Al tomar otra muestra de 25 tazas, es esperable, de igual manera, que la masa presente valores como 250.4 o 251.1 gramos. Un valor medio muestral de 280 gramos en cambio, sería extremadamente excepcional si el contenido medio de las tazas está en la práctica cerca de 250 gramos. Hay un intervalo en torno al valor observado de 250.2 gramos de la media muestral, para el que si la media de la población completa efectivamente toma un valor en este rango, los datos observados no podrían ser considerados particularmente inusuales. Tal intervalo se denomina intervalo de confianza para el parámetro μ. ¿Cómo se calcula tal intervalo? Los extremos del intervalo deben calcularse a partir de la muestra para que resulten funciones estadísticas de la muestra X₁, ..., X₂₅ y de este modo son variables aleatorias a su vez.

En este caso, se determinarán los extremos considerando la media muestral X que como proviene de una distribución normal está también normalmente distribuida con la misma esperanza μ, pero con un error estándar de:

{\frac {\sigma }{\sqrt {n}}}={\frac {2.5~{\text{g}}}{\sqrt {25}}}=0.5\ {\text{gramos}}

Por estandarización, se obtiene una variable aleatoria:

Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}

dependiente del parámetro μ que debe ser estimado, pero con una distribución normal estándar independiente del parámetro μ. Por lo tanto, es posible hallar números −z y z, independientes de μ, entre los cuales está Z con probabilidad 1 − α, una medida de cuán confiados queremos estar.

Tomamos 1 − α = 0.95, por ejemplo. Así, tenemos:

\!P(-z\leq Z\leq z)=1-\alpha =0.95.

El número z proviene de una función de distribución acumulada, en este caso la Función de distribución normal acumulativa:

{\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}

y se obtiene:

{\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\end{aligned}}.

En otras palabras, el límite inferior de un intervalo de confianza del 95% es:

Extremo\ inferior={\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}},

y el superior de tal intervalo es:

Extremo\ superior={\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}.

Con los valores de este ejemplo, el intervalo de confianza es:

{\begin{aligned}0.95&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}

Esto podría interpretarse como: con probabilidad del 0.95 encontramos un intervalo de confianza en el que se cumple que el parámetro μ está entre los límites estocásticos

\!{\bar {X}}-0{.}98

y

\!{\bar {X}}+0.98.

Esto no implica que hay una probabilidad de 0.95 de encontrar el parámetro μ en el intervalo obtenido usando el valor efectivamente establecido para el valor medio de la muestra.

({\bar {x}}-0.98,\,{\bar {x}}+0.98).

Cada vez que se repitan las mediciones, darán otro valor para la media X de la muestra. En el 95% de los casos μ estará entre los límites calculados a partir de la media, pero en el 5% de los casos no lo estará. El intervalo de confianza efectivo se calcula llevando los valores de masas de helado medidas a la fórmula. Este intervalo de confianza de 0.95 resulta:

({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,

[[Archivo:NYW-confidence-interval.svg|thumb|300px|El segmento vertical representa 50 realizaciones de un intervalo de confianza para μ.]]

En otras palabras, el intervalo de confianza del 95% está entre el límite inferior de 249.22 g y el superior de 251.18 g.

Como el valor deseado 250 de μ está dentro del intervalo de confianza resultante no hay razón para creer que la máquina no está correctamente calibrada.

El intervalo calculado tiene límites fijos, donde μ podría o no estar acotado. Así, este evento tiene probabilidad 0 o 1. No es posible decir: "con probabilidad (1 − α) el parámetro μ está en el intervalo de confianza." Sólo sabemos que por repetición en 100(1 − α) % de los casos, μ estará en el intervalo calculado. En 100α% de los casos, sin embargo esto no sucede. Desafortunadamente, no se conoce en cuáles de los casos esto sucede. Por eso se puede decir: "con nivel de confianza 100(1 − α) %, μ está en el intervalo de confianza."

El error máximo se calcula como 0.98 dado que es la diferencia ente el valor en que se conserva la confianza dentro de los límites superior e inferior.

La figura ilustra 50 realizaciones de un intervalo de confianza para una población media dada μ. Si aleatoriamente se selecciona una realización, la probabilidad es del 95% de finalmente haber elegido un intervalo que contenga el parámetro; sin embargo, podría darse la desafortunada situación de haber elegido la errónea.

Véase también

Referencias

↑ Zar, J.H. (1984) Biostatistical Analysis. Prentice-Hall International, New Jersey, pp 43–45.
↑ Es una consecuencia del Teorema Central del Límite.
↑ En la práctica se considera normal la distribución si n > 30.
↑ Sotomayor Velasco, Gabriel. «10.2. Intervalos de confianza para medias». A: Probabilidad y estadística para ingeniería y ciencias. Cengage Learning Editores, 2001.
↑ Véanse en las tablas de la normal tipificada las entradas correspondientes a los valores 0,95 y 0,99
↑ Rius Díaz, Francisca. «8.6.2. Intervalo para una proporción». A: Bioestadística. Métodos y aplicaciones. Málaga: Universidad de Málaga.

Bibliografía

Fisher, R. A. (1956). Statistical Methods and Scientific Inference. Oliver and Boyd, Edinburgh (p. 32).
Freund, J. E. (1962). Mathematical Statistics. Prentice Hall, Englewood Cliffs, NJ (pp. 227-228).
Hacking, I. (1965) Logic of Statistical Inference. Cambridge University Press, Cambridge.
Keeping, E. S. (1962). Introduction to Statistical Inference. D. Van Nostrand, Princeton, NJ.
Kiefer, J. (1977). Journal of the American Statistical Association, 72, 789-827.
Neyman, J. (1937). Philosophical Transactions of the Royal Society of London A, 236, 333-380.
Robinson, G. K. (1975). Biometrika, 62, 151-161.
Zar, J. H. (1984). Biostatistical Analysis. Prentice Hall International, New Jersey. pp. 43-45.

Categoría:Inferencia estadística Categoría:Medición Categoría:Bioestadística Categoría:Econometría Categoría:Investigación operativa Categoría:Psefología

Referències

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Moises.gomez.mateu/proves

[1] Zar, J.H. (1984) Biostatistical Analysis. Prentice-Hall International, New Jersey, pp 43–45.

[2] Es una consecuencia del Teorema Central del Límite.

[3] En la práctica se considera normal la distribución si n > 30.

[4] Sotomayor Velasco, Gabriel. «10.2. Intervalos de confianza para medias». A: Probabilidad y estadística para ingeniería y ciencias. Cengage Learning Editores, 2001.

[5] Véanse en las tablas de la normal tipificada las entradas correspondientes a los valores 0,95 y 0,99

[6] Rius Díaz, Francisca. «8.6.2. Intervalo para una proporción». A: Bioestadística. Métodos y aplicaciones. Málaga: Universidad de Málaga.

[1]

[2]

[3]

[4]

[5]

[6]