Usuari:Oscarnow/valor-p
El valor p (o p-value, en anglès) és la probabilitat que el resultat observat en un experiment sigui degut a l'atzar o no.
S'utilitza habitualment en inferència estadística per dur a terme proves de contrast d'hipòtesi. En aquest cas, el valor p indica la probabilitat d'obtenir un valor igual o més extrem que l'observat en l'experiment, sempre que la hipòtesi plantejada (anomenada hipòtesi nul·la) sigui correcta.[1][2]
Exemple bàsic
[modifica]Plantejament
Un jugador llença un dau tres vegades per comprovar quantes vegades li surt el número "5", el seu "número de la sort". Després d'acabar els llançaments s'adona que el número 5 no ha sortit cap vegada. El jugador es pregunta si ha estat l'atzar o bé "mala sort" (és a dir, ha estat un fet significatiu).
Resposta.
Estem davant d'un cas en què cada tirada només pot tenir dos resultats possibles: o "surt el 5" o "no surt el 5". Aquest cas s'anomena de distribució binominal, és a dir només hi ha dues categories de resultats. Així, en cada tirada del dau el jugador té 1/6 de probabilitats que surti un "5", i 5/6 de probabilitats que no en surti. Atès que la probabilitat de treure 0 vegades un número determinat del dau en tres tirades es pot calcular a través d'una regla de matemàtica combinatòria, obtenim que:
És a dir, el valor p (la probabilitat que el "5" no surti cap vegada) és del 58%. Fet i fet, el jugador no ha tingut "mala sort", atès que tenia més probabilitats que no sortís cap "5" (un 58%), que no que sortís alguna vegada (42%).
El valor p en l'estadística inferencial
[modifica]«Inferir» significa «treure conseqüència», és a dir, deduir una cosa d'una altra. Per tant, la estadística inferencial té com a objecte l'obtenció de conclusions sobre determinats fenòmens d'acord amb l'observació de mostres. Per exemple, les proves estadístiques ens permetran saber si una mostra en la qual s'ha observat un fenomen en una determinada proporció, pot procedir o no d'una població en la qual s'hi dona aquesta proporció.
Així, l'estadística inferencial tracta de resoldre dos problemes:
- Si les diferències observades entre dues mostres s'han produït per atzar, o bé signifiquen que les mostres provenen de dues poblacions diferents.
- Determinar si és probable que el valor obtingut a partir d'una mostra pertany o no a una població. Aquesta prova de comparació és la base per desenvolupar les proves de decisió, també anomenades proves de contrast d'hipòtesi.
Les proves de contrast d'hipòtesi
[modifica]Article principal: Contrast d'hipòtesi
Una part important de les investigacions científiques tenen l'objectiu de contrastar una hipòtesi plantejada (acceptar-la o rebutjar-la) com a possible explicació d'un fenomen. Per poder contrastar la hipòtesi és necessari seguir un procediment estandarditzat de 6 passos.
Passos de les proves d'hipòtesi |
---|
1. Formular les hipòtesis estadistiques. |
2. Elecció d'una prova estadística adequada |
3. Especificació del nivell de significació α i la mida de la mostra N |
4. Trobar la distribució mostral de la proba estadística sobre el supòsit H0 |
5. Definició de la regió de rebuig de la hipòtesi nul·la H0 |
6. Càlcul el valor p i contrast d'hipòtesi. Si aquest valor es troba dins la regió de rebuig, la decisió a prendre és el rebutjar la hipòtesi que hem plantejat (hipòtesi nul·la H0) i acceptar l'alternativa. |
Formulació de les hipòtesis estadístiques
[modifica]Se'n formularan dues: la hipòtesi nul·la H0 (és la hipòtesi que volem contrastar) i la hipòtesi alternativa H1 (és la hipòtesi que acceptarem si no es compleix la hipòtesi nul·la).
Elecció d'una prova estadística adequada
[modifica]En funció del tipus d'investigació que es vol dur a terme i la naturalesa de les dades obtingudes indicarà quina és la prova estadística més adequada. Hi ha dos grans grups de proves:
- Aparamètriques (p. ex. Moda, Mediana, Freqüència, Coeficient de contingència, Coeficient de correlació de Spearman, etc.)
- Paramètriques (p. ex. Mitjana, Desviació tipus, Coeficient de correlació de Pearson, etc.)
Nivell de significació i mida de la mostra
[modifica]El nivell de significació és un llindar arbitrari (establert per l'investigador abans d'obtenir els resultats) que determina si el resultat obtingut en prova estadística és degut a l'atzar, o bé a un efecte causal. El nivell de significació més habitual en les investigacions és de 0,05 o de 0,01. Procediment: Si el valor-p de la prova estadística dona un valor inferior al nivell de significació, llavors es rebutja la hipòtesi nul·la H0 i s'accepta la hipòtesi alternativa H1.
Tanmateix, no es pot estar segur de tot d'acceptar o rebutjar la hipòtesi nul·la. En l'àmbit de les probabilitats, escollir una hipòtesi o una altra (H0 o H1) sempre comporta el risc d'equivocar-se. Atès que hi ha dues alternatives, també hi ha dos tipus d'error. El primer tipus d'error (error Tipus I) és rebutjar H0 quan és verdadera i, el segon (error Tipus II), acceptar H0 quan és falsa.
- Error Tipus I. També anomenat risc α (risc alfa), risc de primera espècie o risc d'error. En aquest cas, quan més gran sigui α, més probable serà equivocar-se rebutjant H0 quan és verdadera. Atès que el valor α (nivell de significació) s'estableix abans de dur a terme l'experiment, quan es contrasta la hipòtesi s'ha d'indicar, per exemple, «es rebutja la hipòtesi H0 amb un risc d'error del 5%».
- Error Tipus II. També anomenant risc β. Aquest risc és sempre desconegut i varia en proporció inversa al valor de α. El risc β es produeix quan en valor p cau en la zona de rebuig de la hipòtesi H0 per atzar. És a dir, s'accepta la hipòtesi H0 quan és falsa.
Els valors α i β han de ser establerts per l'investigador abans de realitzar-se la prova i servirà per determinar la mida de la mostra (N). Normalment, amb l'objectiu de reduir els dos tipus d'errors és recomanable augmentar la mida de la mostra.
Distribució mostral
[modifica]Quan l'investigador ha escollit una prova estadística per treballar amb les dades ha de determinar, tot seguit, quina és la distribució mostral de la prova estadística. Existeixen diferents tipus de distribució de dades:
- Distribució de la població: És la distribució característica d'una població general (p. ex. tots els ciutadans de Catalunya)
- Distribució de la mostra: És la distribució dels elements d'una mostra extreta d'una població més general (p. ex. una mostra de 2.000 persones de Catalunya).
- Distribució mostral: Descriu la conducta esperada d'un gran nombre de mostres aleatòries simples extretes de la mateixa població (p. ex. totes les mostres possibles de 2.000 persones de Catalunya).
Així, la distribució mostral s'obté quan es prenen totes les mostres aleatòries de mida mostral N d'una mateixa població, es calcula l'estadístic (una mitjana o una proporció) i es distribueixen els valors al voltant del paràmetre. Per exemple, considerem la població de Catalunya l'any 1980, que era de 5,9 milions de persones. Ara suposem que extraiem una mostra aleatòria de 2.000 persones i calculem l'edat mitjana dels membres de la mostra. Si repetíssim el mateix càlcul (obtenir la mitjana d'edat) a totes les mostres possibles de 2.000 persones a Catalunya obtindríem la distribució mostral de totes les mitjanes d'edat de la població.
Definició de la regió de rebuig
[modifica]En el següent gràfic es presenten els conceptes comentats en els punts anteriors i com es defineix la regió de rebuig.
Quan el valor p observat en la mostra de l'experiment es troba dins de l'interval de probabilitat (1-α), es considera que la diferència entre el valor px obtingut en l'experiment i el valor p teòric és deguda a l'atzar. En aquest cas no podem rebutjar la hipòtesi nul·la (H0).
Per contra, si el valor px observat no es troba a l'interval (1-α), es considera que la diferència entre el valor px observat i el valor p teòric són significatives i, per tant, no són és deguda a l'atzar. En aquest cas s'ha de rebutjar la hipòtesi nul·la H0 i acceptar la hipòtesi alternativa H1.
Exemple
[modifica]Un equip de sociòlegs està duent a terme un estudi sobre les actituds violentes en els infants. Amb aquest objectiu, l'equip realitza un conjunt de proves «acceptació-rebuig» de la violència als alumnes d'un col·legi. Per intentar provocar pautes de rebuig a la violència, els investigadors proposen la visualització al col·legi de documentals de contingut artístic i científic durant un temps. Així, s'escull una mostra aleatòria de 20 nens i se'ls va fer visionar periòdicament aquest tipus de documentals. En acabar les sessions de documentals, s'aplicà al grup de 20 nens les mateixes proves d'acceptació-rebuig a la violència fetes al conjunt d'alumnes del col·legi.
La predicció dels investigadors és que els nens que han estat sotmesos a les projeccions dels documentals manifestaran un rebuig a la violència superior als alumnes que no hi han fet. Per comprovar els resultats es du a terme una prova de contrast d'hipòtesi.
Resultat de l'experiment: Dels 20 nens que han visionat els documentals, 15 van donar resultats de rebuig a la violència i 5 no van donar resultats d'acceptació a la violència.
Pas 1 - Plantejament d'hipòtesi
[modifica]- Hipòtesi nul·la H0: (p=P). La probabilitat que un nen que ha vist els documentals rebutgi la violència (p) és la mateixa probabilitat que la resta de nens del col·legi que no els han vist (P). És a dir, l'experiment no haurà produït cap diferència.
- Hipòtesi alternativa H1: (p>P). La probabilitat de trobar nens que presentin una actitud de rebuig a la violència després de veure els documentals (p) és superior a la proporció que es trobarà en ala resta d'alumnes del col·legi (P).
Pas 2 - Elecció de la prova estadística adequada
[modifica]Atès que els resultats només poden ser de dues categories (rebuig a la violència - no rebuig a la violència), els investigadors opten per una prova binominal.
Pas 3 - Nivell de significació i mida de la mostra.
[modifica]S'estableix: nivell de significació α= 0,05 (5%) i mida de la mostra N=20
Pas 4 - Distribució mostral
[modifica]Atès que s'ha elegit una prova binominal (P=Q=0,5), la distribució mostral ve determinada per l'expressió:
Amb tot, com la mida de la mostra (N) és inferior a 25 es pot utilitzar una taula predefinida de probabilitats associades amb valors observats de x en les proves binominals.
Pas 5 - Definició de la regió de rebuig de la hipòtesi nul·la H0
[modifica]La zona de rebuig consisteix en tots aquells valors x que són tan petits que la probabilitat associada amb l'ocurrència H0 és igual o menor que el nivell de significació α=0,05. Donat que la hipòtesi alternativa s'ha establert només pel cas p>P (i no per p<P), la regió de rebuig és unilateral.
Pas 6- Càlcul valor p i contrast d'hipòtesi
[modifica]Tenint en compte les variables N=20 i x=5 (freqüència menor), la taula estadística associa un valor p=0,021. Aquesta probabilitat és inferior al nivell de significació α=0,05 que s'havia definit abans de l'experiment. Amb aquest resultat, l'equip d'investigadors estableix les següents conclusions.
- Es rebutja la hipòtesi nul·la H0: La probabilitat que un nen que ha vist els documentals rebutgi la violència és la mateixa probabilitat que la resta de nens del col·legi que no els han vist. És a dir, l'experiment no haurà produït cap diferència.
- S'accepta la hipòtesi alternativa H1: La probabilitat de trobar nens que presentin una actitud de rebuig a la violència després de veure els documentals és superior a la de la resta d'alumnes del col·legi.
Conclusió: Amb un error del 0,05, es pot afirmar que els nens que visualitzen amb freqüència documentals amb continguts artístics i científics en el col·legi, tendeixen a rebutjar la violència en la vida quotidiana en major proporció que els nens que no segueixen només la programació habitual dels mitjans de comunicació de masses.
Bibliografia
[modifica]- ↑ García Ferrando, Manuel. Socioestadística (en castellà). 2006. Alianza Editorial. ISBN 84-206-8700-6.
- ↑ García de Cortázar, Marisa; Arribas, José Maria, et al. Estadística aplicada a las ciencias sociales (en castellà). 2005. UNED. ISBN 84-362-3471-5.