Bon dia,
En la intenció comunicativa de publicar periòdicament informació interessant, útil i d'actualitat sobre el progrés de la Viquipèdia cada certs mesos, us voldria demanar si us agradaria que féssim una nota de premsa sobre els articles més llegits del 2022.
Sí és que sí, hi ha una bona notícia i una altra de dolenta. La dolenta? Encara no està disponible a l'API.
La bona, que tenim temps a definir quins paràmetres i llindars li conferim. Per què llindars? Doncs perquè hi ha falsos positius: en català, basc i gallec els més famosos són Carles Puigdemont i Manuel de Pedrolo. Articles que per alguna raó de bot aranya o de mala gestió de les dades, apareix sobreexpressat com el més llegit de cada dia i en totes aquestes llengües des de fa anys. El més llegit del 2018, que vam anunciar públicament i va passar als mitjans, ja era el de Puigdemont. No vol dir que fos una dada errònia, atesa la transcendència social de llavors i perquè només teníem dades de valors de consulta absoluts.
Ara bé, des de llavors vam començar a detectar coses estranyes i fins i tot se n'han hagut d'obrir dues tasques pendents a Phabricator perquè afecta força llengües ("el món ens mira"). Això ja va fer que, tocant-nos el tema de tant a prop, decidíssim no anunciar els articles més vistos ni del 2020 ni del 2021.
Però això podria canviar si ens aclarim una mica, perquè ara amb l'eina de visites generalista, la que després pot contrastar tothom, es filtrar falsos positius i alhora es mostra el percentatge de visites via mòbil. Al meu parer, el % de lectures mòbils és la clau de tot. Si mireu els més llegits de 2021, queda molt clar que 700.000 visites anuals de les quals un 2,5% són via mòbil (Puigdemont) o 160.000 de les quals un 0,7% són mòbils (Betúria, WTF) no quadren en absolut tenint en compte els usos de dispositius actuals. En canvi, Morad (110.000; 75% mòbil) és una evidència que fou el més llegit del 2021 -més quan la seva entrada fa any i mig només existia en català.
Si som capaços de definir un paràmetre o llindar estadístic a partir del qual assumim que un % de visita mòbil sí que és significatiu i no cal descartar l'article, podem reconstruir la llista i fer-la vàlida. Què en penseu? Ens hi posem i tant aviat com apareguin les dades del 2022 les podem anunciar amb un criteri rigorós? O preferiu deixar-ho córrer?