Vés al contingut

Tema de Viquipèdia:La taverna/Propostes/Arxius/Flow

Pere prlpz (discussiócontribucions)

Tot i la feinada que s'hi ha fet, les categories tendeixen a estar incompletes, o sigui, tendeix a faltar-hi molts articles que hi haurien de ser. Una eina útil per ajudar a resoldre-ho és un bot que posi categories d'acord amb la informació a Wikidata i això està funcionant prou bé amb les categories de biografies per origen, per lloc de la mort, per premis rebuts i per centre educatiu.

Un altre camp on podria ser útil són les categories per activitat. Ara bé, tinc el dubte de si el criteri amb que es posa la propietat Ocupació (P106) a Wikidata és el que fem servir o el que volem a les categories, perquè a Wikidata tendeixen a ser molt més exhaustius i per això m'agradaria llegir més opinions abans de decidir si fer-ho. Per fer-nos-en una idea, categoritzar per activitat d'acord amb Wikidata seria afegir als articles les categories corresponents a les ocupacions que surten a les infotaules.

Per veure què faria exactament aquesta categorització, a Usuari:PereBot/Ocupacions hi ha els enllaços a les consultes amb els articles que no són a la categoria d'una ocupació que tenen segons Wikidata. Us recomano que cliqueu algunes categories, però en poso alguns exemples:

  • Hi ha casos raonables com ara bertsolaris o àrbitres de futbol.
  • Hi ha casos que semblen correctes, només amb el dubte de si l'ocupació és rellevant per tots els articles, com ara bibliotecaris
  • Hi ha casos on l'ocupació sembla posada a Wikidata amb molta més generositat de la que fem servir a les categories, com ara poetes o científics.

Naturalment, aquests enllaços poden ser útils també per categoritzar a mà, tot i que segurament estem parlant de milers d'articles, però el dubte és si seria bo categoritzar-los tots (o tots menys una llista d'excepcions) amb bot.

Xavier Dengra (discussiócontribucions)

Entenc el que vols dir pel que fa a sobrecategoritzar amb professions que sovint no s'expliciten o referencien a la descripció inicial de la biografia. Sovint es tendeix a afegir més oficis o ser "generós" amb les propietats a Wikidata, propietat que per cert acostuma a estar mancada de referències.

Potser seria raonable que el bot creués amb les dues o tres primeres línies de l'article per si el concepte "científic" o "activista" hi apareix també? Amb un creuament de mots a Wikidata+intro de l'article ens podem assegurar que s'afegeixen les mateixes categories (i no massa d'extres) que les descrites al text i/o afegides manualment. Això evitaria que algú estigui en una categoria que no li pertoca per allò que es descriu al propi article. Només és una proposta per evitar crear llistes d'exclusions.

Pere prlpz (discussiócontribucions)

Seria una prova interessant, i encara més si algú volgués fer-ho aplicant-hi intel·ligència artificial, però em sembla que seria molt imprecís. Per que fos efectiu em temo que sortirien molts falsos negatius, o sigui, per evitar que el bot categoritzi articles que no volem, al final categoritzaria només una part petita dels articles que s'han de categoritzar, cosa que seria una millora respecte la situació actual però no sé si valdria la pena l'esforç.

CarlesMartin (discussiócontribucions)

Interessant. Jo diria que no passaria res si el bot categoritza. Sempre hi haurà algun cas concret en què es podria discutir si afegir alguna categoria de les que hi ha a wikidata sobra o no, però tampoc no seria res greu. Un exemple: Jacobus de Cessolis surt a WD com a jugador d'escacs, però nosaltres no el tenim categoritzat com a tal. Segurament jo no el categoritzaria a mà com a jugador d'escacs perquè tot i que és evident que sabia jugar-hi, realment no és conegut com a tal, ni era la seva professió. Sí que és escriptor d'escacs. Però si el bot anés a sac i ho fes, tampoc no veig que fos un problema massa greu.

Pau Colominas (discussiócontribucions)

Sé que el meu comentari desviarà una mica la conversa, però voldria fer notar que els bots que afegeixen aquestes categories xuclades de Wikidata no funcionen correctament amb biografies que tenen categoria pròpia (com ara Joan Brossa i Cuervo / Categoria:Joan Brossa i Cuervo). Les regles de categorització marquen que les categories han de ser sempre les més concretes possibles, per tant una biografia amb categoria pròpia només ha de tenir una categoria: l'homònima. Això fa que en casos com aquest calgui revertir la feina del bot i replicar-la on toca.

Pere prlpz (discussiócontribucions)

Sí i no.

Abans de passar el bot, la categoria no és ni on toca ni on no toca, però el fet és que l'article no és ni directament ni indirectament a la categoria on hauria de ser. Després de passar el bot com a mínim l'article és a la categoria i es pot millorar el compliment de la política posant aquesta categoria a la seva categoria principal. Aleshores, l'edició del bot és una millora respecte a la situació anterior.

De fet, d'acord amb la política actual el que caldria haver fet molt abans que hi passés el bot és posar les categories que falten a tot arreu on toqui, però el bot existeix perquè no s'ha fet.

I aprofitant per seguir desviant el tema, em sembla que la regla de posar sistemàticament a la categoria principal de les biografies (o de qualsevol tema) les categories que altrament posaríem a l'article és força contraproduent, perquè fa que moltes categories acabin uns nivells per sota amb subcategories que no els correspondrien. A Tema:W6qgqgub40dt6bf9 hi ha un exemple de problema que ve a rel d'això, però fins i tot sense fer servir eines automàtiques surten incongruències com que Joan Pau II el tenim en una subcategoria de persones de Buenos Aires i el papa Francesc en una subcategoria de poetes polonesos. Potser hauríem de canviar aquesta pràctica.

Pau Colominas (discussiócontribucions)
Pere prlpz (discussiócontribucions)

Bé, això també és una conseqüència de les regles de categorització que va molt lligada a l'altra. Segurament la solució passaria per o bé no posar categories de persones dins de la categoria d'una persona, o bé no posar totes les categories de la persona a la seva categoria principal.

O sigui, si tot això que ens irrita són conseqüències de les pròpies regles de categorització, el que hem de millorar són les regles de categorització (o aguantar-nos la irritació).

Arnaugir (discussiócontribucions)

O abandonar la categorització, que ja comença a ser obsoleta podent fer consultes a Wikidata...

Paucabot (discussiócontribucions)

Crec que la categorització encara no és obsoleta. Potser un dia ho serà, però aquest dia encara no ha arribat.

La major part dels nostres lectors, quan cerquen compositors catalans al seu cercador preferit, peguen a la categoria. Comparat amb això, cercar a la pròpia Viquipèdia ja és una tasca d'alta complexitat. Si això ja és així, no em vull ni imaginar com d'ínfim és el percentatge de lectors capaç de de fer consultes a Wikidata (la majoria no deu ni saber que existeix).

Pere prlpz (discussiócontribucions)

D'acord amb que cercar a Wikidata és una cosa que només sabem fer una petita part dels lectors, i encara a mitges, i que la resta dels lectors necessiten categories i llistes o com a molt enllaços a consultes a Wikidata ja preparades.

Dit això, la conversa cada cop més més interessant però jo l'havia començada amb la intenció de saber si havia d'engegar el bot per categoritzar per activitat d'acord amb l'ocupació de Wikidata i només hi ha hagut dues intervencions sobre aquest tema. Agrairia algun comentari més.

Arnaugir (discussiócontribucions)

Bé, evidentment em referia a consultes ja preparades ;-) que no sé com s'haurien de presentar a la Viquipèdia.

Pere prlpz (discussiócontribucions)

Si vols una mostra de consultes ja preparades presentades a la Viquipèdia, en tenim alguns prototipus:

  • Des de les categories, pots veure dues llistes automàtiques dins de la descripció de la categoria a categoria:viròlegs. Sobre això també estaria bé rebre comentaris per si ho volem estendre.
  • Llistes com a articles a banda, complementades amb consultes: Pots veure a la Llista de masies del Moianès. A més de la mateixa llista, a dalt a la dreta hi ha un requadre amb mapes. Els dos primers són amb Wikishootme i els dos darrers directament enllaçant una query.
  • A totes les categories de biografies hi ha uns enllaços al Petscan classificant els articles per gènere (tot i que necessita una bona millora).
Xavier Dengra (discussiócontribucions)

Jo soc del parer que, abans d'esmerçar esforços, crítiques i pegats amb plantilles complicades en un aspecte d'interfície que ja trobem (gairebé) obsolet, potser seria interessant començar a plantejar què volem trobar en cerques de Wikidata (tant pel que fa a articles que tenim com que no) i treballar en una nova interfície que reemplaci i substitueixi del tot les categories. Un sistema semiautomàtic de cerques o bé tot fet per nosaltres i que, com a comunitat, plantegem que ens l'activin, o bé que ens la facin a mida i siguem pioners en testar-la per exportar-la a d'altres wikis. En @Townie tenia algunes idees al respecte sobre com visualitzar-ho i que permeti al lector escollir què vol mostrar en funció dels seus gustos i filtres en un desplegable, a banda dels més essencials enciclopèdicament i per defecte relacionats amb l'entrada en qüestió (ex. ofici, època, geografia, distincions).

Amb això, vull dir que soc contrari a estendre, semirobotitzar, xuclar a batzegades de Wikidata sense una estratègia general o desdoblar categories. Per tant, en general, al que s'ha proposat en aquest fil. És allargar-li l'agonia a quelcom pensat per una dècada enrere (fins i tot per editar-les o moure-hi entrades les categories són difícils de fer anar). Cada cop més temes inconclusos, discussions, picabaralles, desgast d'usuaris i addendes de codi per allò que podria fer Wikidata si visualitzéssim quelcom senzill que s'ha de mostrar per a qualsevol lector. Si aconseguim com a conjunt pensar bé un sistema de filtre personalitzat i amb una senzillesa que ens agradi a partir del que hi ha a Wikidata, els desenvolupadors estan per donar suport a la comunitat i fer-lo possible. Pensem-ho en la mateixa línia que la portada, amb maquetes i necessitats, i deixem les categories per a organització de pàgines diferents a l'espai de nom principal.

Pere prlpz (discussiócontribucions)

@Xavier Dengra, la teva proposta és impedir que els usuaris que vulguin es dediquin a millorar les categories perquè no se sap hi haurà una cosa millor que ni se sap com serà? Espero que no sigui això.

O sigui, potser sí que un dia tindrem una cosa millor que les categories, i es perfectament legítim que tu no vulguis dedicar un segon del teu temps a millorar les categories perquè creguis que no val la pena o senzillament perquè no et ve de gust, com ho és que ens recomanis als altres que ho deixem estar. El que no entenc és la oposició a que els altres categoritzem millor amb les eines que hi ha ara i les que puguem crear.

Xavier Dengra (discussiócontribucions)

Disculpa'm, en cap cas pretenia que pensessis el contrari, sempre a favor del Viquipèdia:Llanceu-vos-hi!. Però has demanat comentaris per "si volem estendre", ampliar i automatitzar amb extres de plantilles i addendes que, després d'haver-hi posat certa esma jo també, he arribat a la conclusió que atabalen, sobresaturen i reforcen el concepte de desactualització, excés de botons i mareig en pàgines i en un sistema que ja de per si són massa poc intuïtives i difícils de fer servir i traçar. Altres usuaris hem estat revertits per millorar-les seguint consensos i en d'altres fils s'ha fet palès que hi ha discussions eternes que acaben en un no-res per falta de mans, més reversions o d'altres motius. Per tant la meva resposta a les propostes és que més aviat no i que jo seria favorable a centrar esforços sobre el mateix tema en una altra direcció per quelcom més nou i amb quòrum, de la mateixa manera que d'altres usuaris han proposat fa poc discontinuar el Flow per centrar-se en l'altre sistema de resposta directa. Però és clar que no diria que ho deixis estar si tu ho vols aplicar, com tampoc diria que no a algú que vulgui millorar els Portals (obsolets de fa anys), malgrat que li digui que a llarg termini serà probablement debades.

Pere prlpz (discussiócontribucions)

D'acord amb que les categories tenen moltes mancances, que la Fundació les està deixant de banda (només cal veure que un temps ni sortien a la versió mòbil), que segurament els usuaris les fan servir poc en proporció als esforços que hi dediquem, i que de vegades alguns editors (o no editors que venen a dir-nos què hem de fer) volen fer servir les categories per plasmar un esquema relacionat amb la seva agenda. Ara bé, trigarem a tenir alguna cosa que les substitueixi i mentrestant endreçar-les és una de tantes feines més o menys útils que es pot fer a la Viquipèdia.

Per altra banda, les altres eines que podem acabar tenint hauran de ser de l'estil de les llistes d'articles, generades com sigui. Integrar les llistes a les categories no em sembla una mala opció.

I si havia entès malament la teva oposició potser és perquè m'havia quedat ancorat al principi de la conversa, on el que intentava és aclarir si categoritzar per les ocupacions de Wikidata millora o empitjora les categories. Això i que he anat massa ràpid. Disculpa'm tu.

Pau Colominas (discussiócontribucions)

Per mi:

1. Hem de deixar enrere les categories per avançar cap a sistemes de cerca basats en Wikidata.
2. Si ens hem de mantenir en les categories (o si em situés 10 anys enrere per respondre a la pregunta original del fil), aleshores endavant amb categoritzar automàticament per ocupació.

Per tant, jo no centraria els esforços en la categorització però, si hom ho vol fer, cap inconvenient en categoritzar per l'ocupació de Wikidata.

Pere prlpz (discussiócontribucions)

2. Gràcies.

1. Els sistemes basats en Wikidata que existeixen i són aptes per a lectors són les llistes automàtiques i els enllaços a consultes preparades en alguna eina (principalment Wikidata query i Petscan però també d'altres com Wikishootme), perquè no tenim encara una eina apta per tots els públic i nosaltres ("nosaltres"=els que tenen un nivell tècnic semblant al meu o inferior) no podem fer gaire per per desenvolupar aquesta eina. Aleshores, si l'eina alternativa a les categories són llistes i enllaços, diria que el lloc natural de posar-los són les pàgines de les categories, de manera que encara no ha arribat el moment d'alliberar-nos de les categories.

Resposta a «Categorització per activitat amb bot»