Vés al contingut

Tema de Viquipèdia:La taverna/Ajuda/Arxius/Flow

Correccions automatitzades? ("rentable")

15
Pons (discussiócontribucions)

Benvolguts,

Em dedico a estones perdudes a corregir errates o errors de la Viquipèdia. Ara m'he adonat que hi ha molts articles que contenen la paraula "rentable" en el sentit de "rendible".

¿Seria possible corregir automàticament "rentable" per "rendible" i "rentables" per "rendibles"? O s'ha d'anar fent manualment, un per un?

No cal dir el temps que es guanyaria si es pogués fer d'una tacada, encara que generéssim alguna hipercorrecció (quan la paraula formés part d'una citació en castellà, per exemple).

Gràcies!


A. Pons

Usuari:Pons


Paucabot (discussiócontribucions)

A la Viquipèdia tenim 76 "rentable". Es podria fer amb bot, però diria que millor que es faci a mà ja que són pocs casos i no s'ha de fer el canvi en tots els casos: dels cinc primers de la llista, tres són en castellà.

Pere prlpz (discussiócontribucions)

Notifico en @Jaumeortola que ha estat fent moltíssimes correccions d'aquest tipus amb bot.

I mirant la llista que ens ha passat en Pau, compte que una bona part són correctes, per ser en castellà o per parlar de coses que es poden rentar i no que poden rendir. No sé si és que aquest error surt poc o és que els casos evidents ja han estat corregits.

Pere prlpz (discussiócontribucions)

I hi afegeixo que tot i que no l'he fet servir mai, crec que aquesta mena de feines són les ideals per fer-les amb en:Wikipedia:AutoWikiBrowser, comprovant cada canvi abans d'aprovar-lo.

Paucabot (discussiócontribucions)

En realitat, també es pot fer amb un bot que et demani si vols fer els canvis o no, però només són 76 ...

Jaumeortola (discussiócontribucions)

He fet jo els canvis. Aquests s'han de revisar manualment perquè hi ha casos en què rentable és correcte en català (que es pot rentar: teixit rentable) i hi ha frases en castellà, anglès, francès..., en què també és correcte.

Pons (discussiócontribucions)

Moltíssimes gràcies, Jaumeortola.

He revisat els 30 "rentables" que queden i tots són correctes. He revistat també els 100 primers "rendibles" (d'un total de 837) i tots són correctes.

No sé si existeixen estudis rigorosos sobre què és més econòmic: corregir a mà un a un els errors o bé fer-ho de manera automatitzada. Intuïtivament, aposto per la segona opció, més si existeix algun programa que permet anar validant cadascun dels canvis.

Sovint la perfecció no és compatible amb la possibilitat real d'executar una feina determinada.

Tots volem una Viquipèdia sense faltes. Però jo matisaria: Tots volem una Viquipèdia amb les menys faltes possibles.

Fins ara,

Jaumeortola (discussiócontribucions)

Pons,

Jo estic en la qüestió de la correcció de la Viquipèdia de fa temps. La millor solució que hem trobat fins ara és classificar les correccions en diferents nivells: hi ha substitucions que es fan sempre automàticament (p. ex. composar>compondre), i n'hi ha d'altres que es fan amb diferents nivells de supervisió humana (més o menys ràpida). La pràctica, la intuïció i els coneixements lingüístics ens fan moure els casos d'un grup a l'altre. Evidentment no hi ha garantia d'encertar-la en el 100% dels casos. Si hi ha algun "composar" que és vàlid, s'haurà de refer manualment (i marcar-lo amb un <!--sic--> per a evitar que el bot el torni a esmenar). Però val la pena fer el canvi automàticament perquè les ocurrències correctes de "composar" són quasi nul·les. En canvi, en "rentable" fer el canvi automàtic seria excessiu.

Pons (discussiócontribucions)

Moltes gràcies per la resposta raonada!

Jo m'estic barallant amb el "tamany", difícil de substituir automàticament perquè sovint va acompanyat d'adjectius (i com que "mida" o "dimensió" o "extensió" són mots femenins, cal anar amb cura).

M'estranya que no s'hagi canviat automàticament "dóna". ¿Potser és que el programa no s'identifica les vocals amb accent?

Altres suggeriments per a canvis automàtics: "nomolítica" per "nummulítica" (36 casos). "Abarquen" per "abasten" (30 casos). "S.X" per "segle X" (amb compte, que hi poden haver casos correctes).

En fi, seguim!


Paucabot (discussiócontribucions)
Paucabot (discussiócontribucions)

Un altre cas a corregir: "Veu també". N'hi ha 165, però no tots són una traducció errònia de l'encapçalament Vegeu també.

Pons (discussiócontribucions)

Un cas més, crec que sense complicacions: "nét" (només cal treure-li l'antic accent diacrític). Possible error: quan la paraula formi part de títols d'obres literàries. En total n'hi ha 5.208 casos.I la "néta" no es queda curta: 1.797 casos.

Un altre cas similar seria "féu" que (lamentablement) ha perdut també l'accent. Apareix en 7.532 casos.

No sé si el programa podria detectar els "dobles espais". Potser soc "tiquis-miquis", però ens agradaria que es pogués arreglar.

Un altre cas que no seria tan clar: "adéu". Una gran part dels 777 casos es refereixen a títols de llibres o pel·lícules (que suposo que no es podrien tocar).

Tampoc és tan clar "EE UU" (en lloc d'EUA). No sempre seria correcta la substitució. N'hi ha 502.

A veure com ho veieu...


Jaumeortola (discussiócontribucions)

Estats Units d'Amèrica en català ha de ser evidentment EUA, i no EEUU o altres. Això està parcialment automatitzat (quan pel context és segur que és català). Miraré què es pot fer amb els casos que resten.

Quant als diacrítics, s'hauria de discutir en aquesta pàgina. Als que ens dediquem a tecnologies lingüístiques la reforma dels diacrítics no ens ha semblat gaire encertada. En la comunitat de viquipedistes no hi ha hagut de moment gens d'interès per aplicar els canvis de manera general.

Pons (discussiócontribucions)

Companys,

Hi ha una correcció automàtica que podria ser rendible: "féu" per "feu". N'hi ha 7.500 casos.

Fent-ho, podria ser que introduíssim algun error (quan el "féu" formés part d'una citació d'un text d'abans de la reforma dels diacrítics); però netejaríem moltíssimes errades actuals. Seria un mal menor.

Gràcies.


Resposta a «Correccions automatitzades? ("rentable")»