Vés al contingut

Mitjana

De la Viquipèdia, l'enciclopèdia lliure
Aquest article tracta sobre el concepte estadístic. Vegeu «mitjana (matemàtiques)» pel concepte matemàtic i «mitjana (desambiguació)» per altres significats.
No s'ha de confondre amb Mediana (estadística).
Comparació de la mitjana aritmètica, la mediana i la moda de dues distribucions log-normals amb diferent asimetria

En estadística, el concepte de mitjana té dos significats estretament relacionats:

Hi ha altres mesures estadístiques que no s'han de confondre amb mitjanes, entre elles la mediana i la moda. Altres anàlisis estadístiques simples fan servir mesures de dispersió, com ara l'amplitud, l'amplitud interquartílica o la desviació tipus.

Per una variable aleatòria de valor real X, la mitjana és l'esperança de X. Cal notar que no totes les distribucions de probabilitat tenen una mitjana definida (o variància), com per exemple la distribució de Cauchy.

Per a un conjunt de dades, la mitjana és la suma de tots els valors dividida pel nombre de valors del conjunt. La mitjana d'un conjunt de dades es denota normalment com . Aquesta mitjana és un tipus de mitjana aritmètica. Si el conjunt de dades estigués basat en una sèrie d'observacions obtinguda pel mostreig d'una població estadística, llavors aquesta mitjana s'anomena mitjana mostral () per distingir-la de la mitjana poblacional o x).[2][3] La mitjana se sol donar juntament amb la desviació tipus, ja que la primera descriu la localització central de les dades i la segona en descriu la dispersió. Una mesura alternativa de la dispersió és la desviació mitjana, que equival a la desviació absoluta mitjana de la mitjana: és menys sensible als valors extrems, però matemàticament no és tan amigable per tractar-la.

Si es pren una sèrie d'observacions com a mostra d'una població més gran (per exemple, agafant les alçades d'una mostra d'adults de la població mundial) o bé d'una distribució de probabilitat, llavors la població major es pot utilitzar per construir una "mitjana poblacional" que alhora és el valor esperat per la mostra extreta d'aquesta població. Per una població finita això seria simplement la mitjana aritmètica de la propietat en qüestió per a cada membre de la població; per una distribució de probabilitat, d'altra banda, seria la suma (o integral) sobre cada valor possible ponderat per la probabilitat d'aquest valor. És convenció universal representar la mitjana poblacional per .[4] En cas d'una distribució de probabilitat discreta, la mitjana d'una variable aleatòria discreta x s'obté agafant el producte de cada valor possible de x i la seva probabilitat P(x), i afegint tots aquests valors junts, donant .[5]

La mitjana mostral pot diferir de la mitjana poblacional —especialment per mostres reduïdes—, però la llei dels grans nombres dicta que, com més gran és la mostra, més probable és que la mitjana mostral serà igual a la mitjana poblacional.[6]

Les mitjanes també s'usen en camps diferents de l'estadística, com en geometria i anàlisi, per la qual cosa se n'han desenvolupat molts tipus, els quals es llisten a continuació.

Exemples de mitjanes

[modifica]

Mitjana aritmètica

[modifica]

La mitjana aritmètica és la mitjana "estàndard", i sovint se l'anomena simplement mitjana. Es calcula de la manera següent:[1]

No s'ha de confondre amb la mediana. La mitjana aritmètica d'un conjunt de dades no ha de ser per força el mateix valor que el valor del mig (la mediana) ni el que apareix més cops (el mode). Les distribucions asimètriques es descriuen millor amb la mitjana que no pas amb els altres estadístics (per exemple, la distribució exponencial o la distribució de Poisson).

Per exemple, la mitjana aritmètica dels sis valors 5, 10, 13, 7, 25 i 31 és:

Mitjana geomètrica

[modifica]

La mitjana geomètrica és una mitjana útil per conjunts de nombres positius que són interpretats segons el seu producte i no pas segons la seva suma (com és el cas de la mitjana aritmètica). Per exemple, pot servir per taxes de creixement. El càlcul és el següent:[7]

Per exemple, la mitjana geomètrica dels sis valors 34, 27, 45, 55, 22 i 34 és

Mitjana harmònica

[modifica]

La mitjana harmònica és una mitjana útil per conjunts de nombres definits en relació a alguna unitat, com per exemple la velocitat (distància per unitat de temps). El seu càlcul és el següent:

Per exemple, la mitjana harmònica dels sis valors 34, 27, 45, 55, 22 i 34 és

Relació entre les mitjanes aritmètica, geomètrica i harmònica

[modifica]

Les mitjanes aritmètica (MA), geomètrica (MG) i harmònica (MH) satisfan aquestes desigualtats:

La igualtat es produeix només quan tots els elements de la mostra donada són iguals.

Mitjanes generalitzades

[modifica]

La mitjana generalitzada, també coneguda com a mitjana potencial o mitjana de Hölder, és una abstracció de les mitjanes aritmètica, quadràtica, geomètrica i harmònica. Es defineix sobre un conjunt de n nombres positius xi segons:

Escollint el valor adequat pel paràmetre m s'obtenen totes les mitjanes:

màxim
mitjana quadràtica
mitjana aritmètica
mitjana geomètrica
mitjana harmònica
mínim

Mitjana-ƒ generalitzada

[modifica]

Això es pot generalitzar encara més fins a la mitjana-f generalitzada:

I, de nou, escollint una ƒ invertible adequada donarà:

mitjana aritmètica
mitjana harmònica
mitjana potencial
mitjana geomètrica

Mitjana aritmètica ponderada

[modifica]

La mitjana aritmètica ponderada s'usa si es volen combinar els valors mitjans de mostres procedents de la mateixa població amb diferents mides mostrals:

Les ponderacions representen els límits de la mostra parcial.

Mitjana truncada

[modifica]

De vegades un conjunt de nombres pot contenir valors molt extrems, és a dir, molt més elevats o inferiors que els altres. Normalment se sol tractar de dades errònies causades per l'error experimental. La mitjana truncada, doncs, consisteix a descartar certes parts de les dades (les parts superior i inferior, normalment la mateixa quantitat als dos extrems) i després en fer la mitjana aritmètica de les dades restants. El nombre de valors extrets s'indica pel percentatge respecte al nombre total de valors.

Mitjana interquartílica

[modifica]

La mitjana interquartílica és un exemple específic de mitjana truncada: és simplement la mitjana aritmètica feta després de treure la quarta part de valors per sota i per sobre.

Mitjana d'una funció

[modifica]

En càlcul, i especialment en càlcul amb diverses variables, la mitjana d'una funció es defineix de manera general com el valor mitjà de la funció sobre el seu domini. Si només es té una variable, la mitjana d'una funció f(x) sobre un interval (a,b) es defineix per:

Cal recordar que una propietat del valor mitjà de molts nombres finits és que . En altres paraules, és el valor constant que, quan s'afegeix a ell mateix vegades, és igual al resultat d'afegir els termes de . Anàlogament, una propietat del valor mitjà d'una funció sobre l'interval és que . En altres paraules, és el valor constant que, quan s'integra sobre , és igual al resultat d'integrar sobre . Però segons el segon teorema fonamental del càlcul, la integral d'una constant és tan sols:

Vegeu també el primer teorema del valor mitjà per la integració, el qual garanteix que si és contínua llavors existeix un punt tal que

El punt s'anomena el valor mitjà de sobre ; s'escriu, doncs, , i es reordena l'equació precedent per aconseguir la definició de sobre.

Si es tenen múltiples variables, la mitjana en un veïnat d'un subespai relativament compacte U en un espai euclidià es defineix per:

Això generalitza la mitjana aritmètica. D'altra banda, també és possible generalitzar la mitjana geomètrica per a funcions definint la mitjana geomètrica de f per

De manera encara més general, en teoria de mesura i teoria de probabilitat els dos tipus de mitjana tenen gran importància. En aquest context, la desigualtat de Jensen estima la relació entre aquestes dues nocions diferents de la mitjana d'una funció. Finalment, cal notar que també existeixen la mitjana harmònica i la mitjana quadràtica (o valor eficaç) d'una funció.

Mitjana d'una distribució de probabilitat

[modifica]

Vegeu esperança matemàtica.

Mitjana d'angles

[modifica]

La majoria de les mitjanes més utilitzades no serveixen per quantitats circulars com angles, temps i fraccions de nombres reals. Per aquestes quantitats es necessita la mitjana de quantitats circulars.

Mitjana de Fréchet

[modifica]

La mitjana de Fréchet dona una manera per determinar el centre d'una distribució de masses en una superfície o, més generalment, en una varietat de Riemann. De manera diferent a altres mitjanes, la de Fréchet es defineix en un espai els elements del qual no han de poder necessàriament ser afegits els uns als altres o ser multiplicats per escalars. També es coneix aquesta mitjana per mitjana de Karcher.

Altres mitjanes

[modifica]

Propietats

[modifica]

Tots els tipus de mitjanes comparteixen algunes propietats. Algunes d'aquestes es llisten a continuació.

Mitjana ponderada

[modifica]

Una mitjana ponderada M és una funció que enllaça tuples de nombres positius amb nombres positius:

De tal manera que es mantenen les següents propietats:

  • Punt fix:
  • Homogeneïtat: per tot λ i xi. En notació vectorial: per tots els n-vectors x.
  • Monotonia: si per tot i llavors .

Segueix:

  • Limitació:
  • Continuïtat:
  • Hi ha mitjanes que no són diferenciables.
  • Totes les mitjanes llistades més amunt, amb l'excepció de la majoria de les mitjanes-f generalitzades, satisfan les següents propietats:
    • Si f és bijectiva, llavors la mitjana-f generalitzada satisfà la propietat de punt fix.
    • Si f és estrictament monòtona, llavors la mitjana-f generalitzada satisfà també la propietat de monotonia.
    • En general una mitjana-f generalitzada no té homogeneïtat.

Les propietats de sobre impliquen tècniques per a construir mitjanes més complexes:

Si C, M1, ..., Mm són mitjanes ponderades i p és un nombre real positiu, llavors A i B definides per

també són mitjanes ponderades.

Mitjana sense ponderar

[modifica]

Tal com es pot intuir, una mitjana sense ponderar equival a una mitjana ponderada amb el mateix pes per cada valor; una altra manera de dir-ho és que una ponderació homogènia permet canviar els paràmetres de ponderació sense que el resultat es vegi alterat.

Es defineix M, doncs, com una mitjana sense ponderar si és una mitjana ponderada que per cada permutació π dels pesos de ponderació el resultat és el mateix.

  • Simetria: per totes les n-tuples π i permutacions π sobre n-tuples.

De manera anàloga a les mitjanes ponderades, si C és una mitjana ponderada, són mitjanes sense ponderar, p és un nombre real positiu, llavors A i B definides per

també són mitjanes sense ponderar.

Mitjanes poblacionals i mostrals

[modifica]

La mitjana d'una població té una esperança de μ, coneguda com la mitjana poblacional. La mitjana mostral és un bon estimador estadístic de la mitjana poblacional, ja que el seu valor esperat és el mateix que la mitjana poblacional. La mitjana mostral d'una població és una variable aleatòria no constant i, conseqüentment, té la seva pròpia distribució. Per una mostra aleatòria de n observacions d'una població distribuïda normalment, la distribució de la mitjana mostral és:

Sovint, com que la variància poblacional és un paràmetre desconegut, s'estima per la suma de quadrats mitjana, que canvia la distribució de la mitjana mostra d'una distribució normal a una distribució t de Student amb graus de llibertat.

Referències

[modifica]
  1. 1,0 1,1 Mean. Weisstein, Eric W. MathWorld (anglès)
  2. «List of Probability and Statistics Symbols» (en anglès), 26-04-2020. [Consulta: 21 agost 2020].
  3. Underhill, L.G.; Bradfield d. (1998) Introstat, Juta and Company Ltd. ISBN 0-7021-3838-X p. 181
  4. Underhill, L.G.; Bradfield d. (1998) Introstat, Juta and Company Ltd. ISBN 070213838X p. 181
  5. Elementary Statistics, Robert R. Johnson i Patricia J. Kuby, p. 279
  6. Schaum's Outline of Theory and Problems of Probability, Seymour Lipschutz i Marc Lipson, p. 141
  7. «mean | mathematics | Britannica» (en anglès). [Consulta: 10 febrer 2022].

Vegeu també

[modifica]

Enllaços externs

[modifica]