Vés al contingut

Usuari:PereBot

De la Viquipèdia, l'enciclopèdia lliure
Robot Aquest usuari és un bot administrat per l'usuari Pere prlpz (discussió).

És un usuari especialment creat per a editar articles de la Viquipèdia de manera automatitzada o semiautomatitzada.

Administradors: Si aquest bot està fent edicions problemàtiques, si us plau bloqueu-lo.


Contribucions

[modifica]

Subpàgines

[modifica]

Repositoris de programes

[modifica]

Els meus

[modifica]

Amb Python

[modifica]

Amb R

[modifica]

Wikidata query service

[modifica]

Tot i que no són programes, a d:User:Pere prlpz i a c:User:Pere prlpz hi ha reculls de queries.

Els dels altres

[modifica]

Categorització automàtica

[modifica]

Tot i la immensa feinada feta a mà en les categories durant anys, una gran part de les categories contenen molts articles menys dels que haurien de contenir.

Una de les feines que ha fet durant un temps el bot és la d'omplir categories existents a partir de la informació de Wikidata. De moment omple categories per origen, per lloc de la mort, per premi rebut i per centre educatiu.

Trets generals

[modifica]
  • El bot no crea categories sinó només omple les que existeixen (excepció: el bot va crear la majoria de categories per centre educatiu). De moment la idea és que els editors humans puguin dedicar-se a crear categories i puguin deixar al bot la feina d'omplir-les.

Categories a partir de Wikidata

[modifica]
  • Les categories s'identifiquen no a partir del que diu l'element de la categoria a Wikidata sinó a partir del que diu l'element sobre el tema. Per exemple, que la Categoria:Cornellanencs conté articles de la gent de Cornellà de Llobregat surt de que Cornellà de Llobregat (Q15602) té la propietat Categoria de persones relacionades (P1792) amb el valor Categoria:Cornellanencs (Q19154208), que està enllaçat a Categoria:Cornellanencs.
  • El bot no posa categories redundants amb les que ja hi ha i intenta treure les que hi hagi que siguin redundants amb les que posa. O sigui, el bot posa categories més concretes que les que ja hi ha a l'article.
  • Per comprovar quins articles ja són en una categoria el bot llegeix la categoria i totes les seves subcategories. En alguns casos en que tenim subcategories que no són subconjunts (i que de vegades són molt forçades) això porta a que el bot no posi categories que es podrien posar.
  • Tot i que estaria bé que el bot fos exhaustiu, sovint no ho és per quedar de la banda de la seguretat i no posar categories que no corresponen.
  • Si el bot posa categories errònies se'l pot revertir, però per que no les torni a posar el següent cop s'ha d'arreglar l'error a Wikidata. Bona part de les vegades l'error que causa una categoria incorrecta ja causava que sortís una dada incorrecta a la infotaula i la categorització incorrecta el posa de manifest.

Particularitats

[modifica]

Categories a partir d'interseccions

[modifica]

Estic començant a posar categories a partir d'interseccions de categories existents, començant per les categories per origen i activitat.

Aquest procés té dues parts: primer identificar les categories que s'han d'intersecar (o sigui, esbrinar que els articles que són a la categoria:Pintors i a la categoria:Gironins i les seves subcategories haurien d'anar a la categoria:Pintors gironins) i després buscar i traslladar els articles.

Aquest procés és sensible tant als errors de Wikidata com als de les categories.

Origen i ocupació

[modifica]

Aquí el bot fa servir, de Wikidata:

  • Les propietats Categoria de persones relacionades (P1792) i Categoria per a les persones nascudes aquí (P1464) de l'element de cada lloc per identificar les categories de persones d'aquell origen (normalment les nostres categories per origen estan en un dels dos grups).
  • La propietat Categoria principal (P910) de l'element de cada professió per identificar la categoria per ocupació. El mateix es fa amb els elements que tenen instància de Identitat personal (Q844569) per treure'n algunes categories per ideologia.
  • Per identificar les categories per ocupació i origen i a quina ocupació i quin origen correspon fa servir dos mètodes diferents:
    • Wikidata: El bot mira que l'element de la categoria tingui Categoria conté (P4224) igual a Ésser humà (Q5) i que tingui dos valors a Temes associats per la categoria (P971) (o tres si un és Persona relacionada amb aquest lloc (Q19660746)) un dels quals sigui un lloc del qual tinguem categoria per origen i l'altre sigui una ocupació de la que tinguem categoria per activitat. Una limitació d'aquest sistema és que aquesta informació només està declarada per unes 1300 categories, en la majoria de les quals l'origen correspon a un estat.
    • Que el nom de la categoria estigui format amb la unió del nom de la categoria per ocupació i la categoria per lloc. Això permet identificar uns quants milers de categories tot i que de moment deixa fora les que tenen una forma més o menys irregular.
  • Per identificar categories principals de persones i excloure-les de l'arbre de categories en llegir, fa servir la propietat Categoria principal (P910) dels items de persones.

Noms

[modifica]

En alguns grups buscar a Wikidata les categories per intersecar no és suficient i el bot es basa en els noms de les categories. Això passa dins de les categories de biografies per grup humà i les categories de persones de l'àmbit catalanoparlant i està previst fer el mateix amb els escriptors per llengua.

Executant la intersecció

[modifica]

Un cop té la llista de les categories a intersecar, el bot comença ordenant-les per començar per les categories més petites (més petites en el sentit de tenir menys subcategories tant les categories a intersecar com la categoria resultat) per millorar l'eficiència i per tal d'evitar editar repetidament els mateixos articles per anar posant categories cada cop més concretes.

A partir d'aquí, el bot comprova que la categoria intersecció sigui subcategoria de les categories a intersecar (per evitar errors causats per noms ambigus), llegeix el que hi ha a les tres categories, i posa la categoria intersecció a tots els articles que siguin a les altres dues totes dues i encara no la tinguin, i en treu les categories redundants amb la que ha posat.

Projectes futurs

[modifica]

Projectes futurs d'omplir categories automàticament que poden ser realitat algun dia o no.

  • Estendre el mateix procés d'intersecar automàticament categories a altres criteris més enllà de les categories per origen i activitat.
  • Categories per gènere en cas que mai s'arribi a aprovar una categorització que incorpori el gènere a les característiques per les que es poden categoritzar biografies.
  • Categories de rius per conca.

Altres feines habituals

[modifica]

Aquest bot posa de tant en tant les plantilles {{Autoritat}} i {{BDT}} als articles on no són però que a Wikidata hi ha informació de la que surt en aquestes plantilles. Els articles on posar-les es troben amb una consulta al PetScan.