Vés al contingut

Precisió i exhaustivitat

De la Viquipèdia, l'enciclopèdia lliure
(S'ha redirigit des de: Precisió i reclam)
Precisió i exhaustivitat

En reconeixement de patrons, recuperació d'informació i classificació (aprenentatge automàtic), la precisió i l'exhaustivitat són mètriques de rendiment que s'apliquen a les dades recuperades d'un magatzem de dades, un corpus o un espai mostral.

La precisió és la fracció de casos veritablement positius entre els casos seleccionats com a positius.

L'exhaustivitat (també anomenada sensibilitat, quan es compara amb l'especificitat) és la fracció de casos veritablement positius entre els casos rellevants.

Tant la precisió com l'exhaustivitat són mesures de la rellevància.

En termes de falsos positius i falsos negatius, s'expressen amb les fórmules següents:

Exemples

[modifica]

Suposem que un programa d'ordinador per a reconèixer gossos en fotografies identifica 8 gossos en una fotografia que conté 12 gossos i alguns gats. Dels 8 identificats com a gossos, 5 són realment gossos (veritables positius), mentre que la resta són gats (falsos positius). La precisió del programa és 5/8 i l'exhaustivitat és 5/12.

Suposem un motor de cerca que retorna 30 pàgines. D'aquestes, només 20 són rellevants, mentre que en falten 40 de rellevants per retornar. La precisió del motor és 20/30 = 2/3 i l'exhaustivitat és 20/60 = 1/3. Així doncs, en aquest cas, la precisió és "com són d'útils els resultats" i l'exhaustivitat és "com són de complets els resultats".

Definició

[modifica]

En contextos de recuperació d'informació, la precisió i l'exhaustivitat es defineixen en termes d'un conjunt de documents recuperats (per exemple, la llista de documents produïts per un motor de cerca a una consulta) i un conjunt de documents rellevants (per exemple, la llista de tots els documents a Internet que són rellevants per un tema). Les mesures van ser definides a Kent et al. (1955).

Precisió

[modifica]

En el camp de la recuperació d'informació, la precisió és la fracció de documents recuperats que són rellevants per a la consulta:Per exemple, per una cerca de text en un conjunt de documents, la precisió és el nombre de resultats correctes dividits pel nombre de resultats retornats.

La precisió té en compte tots els documents recuperats, però també es pot avaluar en un punt de tall n donat, considerant només els n primers resultats retornats pel sistema. Aquesta mesura s'anomena precisió a n.

La precisió s'usa juntament amb l'exhaustivitat, el percentatge de tots els documents rellevants que són recuperats per la recerca. Les dues mesures són a vegades usades juntes en la puntuació F1 (o mesura F) per a proporcionar una sola mesura per a tot el sistema.

Observeu que el significat de precisió en el camp de la recuperació d'informació difereix de la definició d'exactitud i precisió en altres branques científiques i tecnològiques.

Exhaustivitat

[modifica]

En el camp de la recuperació d'informació, l'exhaustivitat és la fracció dels documents rellevants que són recuperats per la consulta: ⁣Per exemple, per una cerca de text a un conjunt de documents, l'exhaustivitat és el nombre de resultats correctes dividits pel nombre de resultats que s'haurien d'haver retornat.

En classificació binària, l'exhaustivitat s'anomena sensibilitat. Pot ser vista com la probabilitat que un document rellevant sigui recuperat per la consulta.

És trivial d'aconseguir una exhaustivitat del 100% si es retornen tots els documents en resposta a qualsevol consulta. Per això, l'exhaustivitat per si sola no és una mesura prou bona, sinó que cal considerar també el nombre de documents no rellevants, calculant la precisió, per exemple.

Mesura F

[modifica]

Una mesura que combina la precisió i l'exhaustivitat és la seva mitjana harmònica, anomenada mesura F o puntuació F equilibrada:Aquesta mesura és aproximadament la mitjana de la precisió i l'exhaustivitat quan els valors són propers. Més generalment, és la mitjana harmònica de la precisió i l'exhaustivitat, que és el quadrat de la mitjana geomètrica dividida per l'aritmètica. La puntuació F pot ser criticada per diverses raons en circumstàncies particulars a causa del seu biaix com a avaluació mètrica.[1]

És el cas particular de la mesura general (per valors reals no negatius de ):Dues mesures utilitzades sovint són la mesura , que posa més de pes a l'exhaustivitat que a la precisió, i la mesura , que posa més d'èmfasi en la precisió que en l'exhaustivitat.

La mesura va ser derivada per van Rijsbergen (1979) de manera que mesurés "l'efectivitat de recuperació respecte a un usuari que considera vegades més important l'exhaustivitat que la precisió". Es basa en la mesura d'efectivitat de van Rijsbergen , on el segon terme és la mitjana harmònica ponderada de la precisió i l'exhaustivitat amb pesos . La relació és on .

Notes

[modifica]

Referències

[modifica]
  1. Powers, David M W «Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation». Journal of Machine Learning Technologies, 2, 1, 2011, pàg. 37–63. Arxivat de l'original el 2019-11-14 [Consulta: 17 juliol 2020].

Bibliografia

[modifica]
  • Kent, Allen; Berry, Madeline M.; Luehrs, Jr.; Fred, U.; Perry, J. W. «Machine literature searching VIII. Operational criteria for designing information retrieval systems» (en anglès). American Documentation, 6, 2, 1955, pàg. 93. DOI: 10.1002/asi.5090060209.