Amadalvarez (discussiócontribucions)

estem fent proves d'infotaules multilingüe i ens cal que algú ens verifiqui si l'escriptura en aquestes llengües dreta-esquerra és correcta. No és una feina de traducció, sinó de validar la maquetació i/o errors de sintaxi en el resultat final.

Podeu veure les proves a Plantilla:Proves_persona/RTL i deixar els vostres comentari sobre errors, suggeriments o millores a la seva pàgina de discussió. Si hi ha errors de traducció, els podeu corregir vosaltres mateixos a WD. Si trobeu textos en anglès, vol dir que no existeix el label per aquesta llengua a WD, també ho podeu corregir.


Pere prlpz (discussiócontribucions)

Notifico en @CarlesVA per si hi està interessat.

Pere prlpz (discussiócontribucions)
ESM (discussiócontribucions)

O potser l' @Amire80 també pot donar un cop de mà.

Amadalvarez (discussiócontribucions)

Ell forma part de l'encàrrec, però volia algú que m'ajudés a polir-les abans de mostrar-li.

CarlesVA (discussiócontribucions)

L'escriptura és correcta. Hi ha un problema en l'alçada, però jo no el sé corregir. He marcat un error de concepte a la discussió.

Amadalvarez (discussiócontribucions)

@CarlesVA quan dius alçada, et refereixes a la del Cruyff en àrab ?. o també està malament a l'Obama ?.

El tema del naixement ja sabia que estava agafat amb pinces. La primera intenció va ser agafar "data de naixement", però com que també incorpora nom i lloc vaig optar per un terme més genèric que no té perquè comportar-se de forma similar a les altres llengües. Vaig triar naixement (Q14819852) perquè la relativa al part entenia que era part (Q34581), però ja es veu que la diferenciació per cultures pot donar algun problema. Bé, ja hi pensarem alguna solució menys arriscada perquè el canvi que has fet, qualsevol el pot tirar enrere raonablement.


CarlesVA (discussiócontribucions)

El concepte data inclou tant la data (data crònica) com el lloc (data tòpica), per tant no hauria de ser problema, ans al contrari. Tanmateix, no és possible agafar el "camp" "data de naixement" de WD, però que només es visualitzi "naixement"?

CarlesVA (discussiócontribucions)

Hi ha també una solució a WD (però de nou pot ser revertit per qualsevol en qualsevol moment) que seria canviar "data de naixement" per "nascut en" (entre els sinònims de "data de defunció" en anglès hi ha "died on", que respon perfectament a aquesta idea).... el problema de WD és que és molt volàtil i pleníssima de "doblets", sobretot en entrar a parlar de conceptes...

Amadalvarez (discussiócontribucions)

De fet, el mètode que apliquem té previst definir textos excepcionals quan no t'agrada/encaixa allò que recupera de WD.

De partida, miro de posar el millor concepte possible i no definir cap excepció perquè s'ha de fer llengua a llengua i no sé a priori a quina llengua li cal i a quina ja li està bé el que diu WD. Per això ho deixo com a feina pel moment de la instal·lació i que cadascú ho acabi d'ajustar.

D'altra banda, no podem canviar el nom de les propietats al servei d'aquesta feina, perquè han de servir per descriure de forma no ambigua les dades que entrem. Posar-li "nascut (en, el, a..)" a la data de naixement despistaria en el moment d'entrar dades.

Per últim, aquest problema sembla que tindrà més opcions a mig termini perquè volen carregar dins WD els continguts dels Wikidiccionaris i poder incorporar lexemes.


CarlesVA (discussiócontribucions)

Sí, només en el cas de Cruyff. Suposo que és un problema en el conversor de cm a m.

Un altre tema és que la taula combina (aparentment de forma aleatòria) xifres índies (usades tradicionalment pels àrabs) amb xifres àrabs (adoptades molt recentment). En principi totes dues són comprensibles per a tots els àrabs, tot i que els àrabs orientals tendeixen més a usar les primeres sempre, mentre els occidentals pràcticament les han abandonades.

Amadalvarez (discussiócontribucions)

Lo del Cruyff ja ho tenia detectat però encara no m'hi he posat a investigar.

Aviso al @Vriullop del tema xifres que deu saber perquè.


Vriullop (discussiócontribucions)
  • Quan el valor de Wikidata està en format numèric li aplica el format de llengua, per això el pes surt en xifres àrabs (no aràbigues) en canvi el dorsal està en format text i surt tal qual.
  • Per l'alçada la nostra plantilla no sap interpretar {{convert|١٨٠}}. Provat a ar.wiki tampoc funciona perquè allà l'operativa de la plantilla és diferent. En altres llengües podrien sortir resultats inesperats segons el format de separadors de decimals.
  • Per les dates falta adaptar la plantilla:circa. Passada al mòdul en proves surt la data de naixement ٢٥ أبريل ١٩٤٧
CarlesVA (discussiócontribucions)

En principi, tot i que no el puc entendre, crec que l'hebreu també està correcte, en relació a l'escriptura.

CarlesVA (discussiócontribucions)

Una curiositat... i per què calen taules multilingües?

Amadalvarez (discussiócontribucions)

Estem reconvertint les nostres plantilles per poder-les internacionalitzar i així migrar-les de forma "quasi" automàtica a les altres wikis. És un tema que estem treballant amb la gent de Wikidata que estan força interessats especialment per les WPs petites que no tenen capacitat per a desenvolupar i mantenir tantes plantilles.

No descartis que e torni a emprenyar en algun altre moment.


Amire80 (discussiócontribucions)

Català:@CarlesVA, estic d'acord amb @Amadalvarez: molts viquis tenen plantilles de funció similar amb codi viqui distint. No hi ha una bona raó fer la mateixa cosa diferentment de nou en cada viqui. I hi ha viquis, especialment els amb poca gent que escriu articles, que volen plantilles d'infotaules i no les tenen, i copiar-les d'altres viquis serà un procès molt manual i difícil. És millor que inverteixin llur temps i esforç en escriure articles i no en el manteniment de plantilles que ja són construïdes. Construir plantilles en una manera que es fàcil copiar a altres llengües sense canvi de codi viqui serà, per això, una cosa molt bona, que estalviarà molt de temps a tothom.

English: @CarlesVA, I agree with @Amadalvarez: many wikis have functionally similar templates with different wiki syntax. There is no good reason to do the same thing again and again. And some wikis, especially those with very few contributors, want infobox templates, but don't have them at all, and porting them from other wikis is a very difficult and manual process. They should invest their time and effort in writing actual articles and not in maintaining templates that were already built. Building templates in a way that is easy to port across languages with no wiki syntax change would thus be a very desirable thing, which will save everybody a lot of time.

Vriullop (discussiócontribucions)

Com a resultat col·lateral es podrien mostrar les infotaules en la llengua de les preferències de l'usuari. Cal pensar que aviat les preferències seran globals, ja ho són excepte Viquipèdies. Una opció és fer-ho fora dels articles, per exemple en pàgines d'usuari o en la documentació de plantilles.

Amadalvarez (discussiócontribucions)

Has dit documentació de plantilles ?. Horreur !! quina feinada ens espera

Vriullop (discussiócontribucions)

Cap feina, és 'tomàtic. Els exemples sortirien en la llengua de l'usuari. La idea és que, si no es defineix cap llengua, per defecte sigui la del lloc en els articles i la de l'usuari en altres espais.

El que sí que serà imprescindible és traduir a l'anglès Mòdul:Wikidata/ús.

Amadalvarez (discussiócontribucions)

Els exemples, si. Jo em referia a la documentació d'ús.

En tot cas ja hi comptava que aquesta aventura del multilingüe portava aparellat escriure una memòria en anglès.

Amire80 (discussiócontribucions)

Very sorry for replying in English. It would take me way too long to type this in Catalan and I may be mistaken about some technical terms.

The biggest issue that I see is that the names of the property labels are aligned to the left. The direction of the <th> elements is correctly set to "rtl", but the alignment (CSS text-align) is "left". It appears to be explicitly set somewhere. It should be either left unset, so that the RTL direction would automatically set to to "right", or it should be explicitly set to "right". There's also the possibility that it is set somewhere explicitly in the CSS files of the Catalan Wikipedia, and that when it is used in an RTL wiki, it will be correct. I'm not sure.

Many dates appear to be written in Catalan in the athlete box, but not in politician.

"Parturition" was written in French (or English) instead of Hebrew. It probably used Q14819852. After I translated its label to Hebrew, it started appearing correctly. However, this makes me think: should it be Q14819852 or maybe Q34581? I don't have a strong opinion myself.

"centímetres" is written in Catalan. Where can this be translated? Or is it already translated, and appears in Catalan because it's in the Catalan Wikipedia?

For ranges of dates, such as "1964-1973", it's important to use the en dash: –. It should be "1964–1973" and not "1964-1973". It's especially important in Hebrew because this makes the direction of the range correct, from right to left. There were long and heated discussions about this in the Hebrew Wikipedia, and eventually the community decided that it should follow the recommendation of Unicode and of the Academy of the Hebrew Language and use the en dash and not the hyphen, and this is followed consistently everywhere, including article titles; for an example, see מלחמת דרום אוסטיה (1991–1992). It may be a good practice to use the en dash in other languages, too. At least some date ranges appear to be correct in the politician box, but not in athlete.

When a label is not translated, there really should be a link to translating it. A link to an item is OK, clearly labeled as "translate". I see that some are marked with a pencil in politician, but not in athlete.

Obama is marked "44è"—the "è" is Catalan :)

Purely an RTL issue: The pencil icons in the politician box are misplaced. Look at "Kwame Raoul" and "Alice Palmer". The pencils icons must be together in the same element with the name, and the whole element must be isolated. For example, using the <bdi> tag or using "unicode-bidi: isolate" in CSS.

The arrows at "Kwame Raoul" and "Alice Palmer" are pointing in the wrong directions.

That's all I can see till now. Hope it helps.

Thanks for your work, and for testing with RTL languages!

Amire80 (discussiócontribucions)

Oh, another thing: where is the "Parents" label taken from? It's translated into Catalan ("Pares"), but not into Arabic or Hebrew.

Amadalvarez (discussiócontribucions)

@Amire80 Gràcies per la teva resposta.

Hem intentat agafar el concepte WD (principalment properties però també items) que millor s'ajusten al significat. Però com no sempre és possible, el model en que estem treballant disposa d'una llista de textos i excepcions al label recuperat de WD quan no s'adapta correctament, com ara "Pares" o "Naixement", i també quan el text retornat és massa llarg per una etiqueta i no podem canviar-lo a WD per a no alterar el seu significat. Òbviament, aquestes excepcions s'han de crear per cada llengua i, per tant, ho estàvem situant en el moment de la instal·lació en cada WP.

Com que ara ens interessava fer proves en diverses llengües, només ho tenim pel cas català (com el cas de "pares") o no tenim (com el cas de Parturition) on probablement serà una de les dues opcions que comentes segons la llengua i, el més fàcil serà crear una excepció que posi el text que més encaixi sense fer servir WD. En resum, no em preocupa excessivament els desajustos de traducció de labels, ja que corregir-lo quan s'instal·li a cada llengua no requerirà canvis en el codi de les infoboxes.

Altres coses comentades que s'arreglaran quan s'instal·li a la seva pròpia WP:

  • 44è. Ho calcula la template:ordinal que existeix a cada llengua i, per tant, agafarà la que correspongui. Estic mirant que els paràmetres coincideixin i que la instal·lació sigui fàcil.
  • centímetres (català). Els textos de les unitats passen pel mòdul:wikidata i/o per la template:convert que els generen o modifiquen. Hem d'assegurar que quan s'instal·li, les corresponents versions lingüístiques del mòdul i convert ho resolen.

Els altres comentaris són temes a analitzar i corregir.

you say "Hope it helps". Yes, you help a lot.


Vriullop (discussiócontribucions)

Seguint amb els punts de l'Amire:

  • Etiquetes alineades. Això està definit a Mòdul:Infobox, ":css('text-align', 'left')". No es pot eliminar perquè usa un <th> que per defecte sortiria centrat. Caldrà tenir-ho en compte en la instal·lació en un wiki RTL.
  • Dates. El format per defecte està definit a Mòdul:Wikidata/i18n que cal adaptar en cada llengua. A banda del format, si és l'europeu "j F Y", l'americà "F Y j" o el que sigui, com a mínim el nom del mes hauria de sortir traduït sempre. El que passa amb les dades de naixement i defunció és que la plantilla:circa no està migrada a la versió multilingüe. Provant-ho surt la data de naixement de Cruyff en hebreu "25 אפריל 1947"
  • Guions llargs. Em sembla raonable canviar els guionets per guions llargs. Amador, t'encarregues de localitzar-los?
  • Etiquetes no traduïdes. Quan s'obtenen de Wikidata puc afegir un llapis igual que amb les dades. M'ho anoto com a pendent.
  • Etiqueta bidireccional <bdi>. M'ho miro, pendent.
Amadalvarez (discussiócontribucions)

M'encarrego del guió llarg (per a tots els idiomes, inclòs català), de les fletxes de successions que surten a l'inrevés.

Lo de circa, ja està previst però mentre fem servir /proves/lang no puc canviar-la perquè és compartida amb infotaules en producció.

Penso que ens caldrà tenir un paràmetre RTL=yes per avisar-li a la infotaula que els textos que són una concatenació de paràmetres s'han d'invertir (any-any, fletxes successions, unitats en cm+metre en alçada esportista, ....) i també els align dins entorn cawiki.

També parlava de manca de llapis. Això passa en les formatting=table, ja que el que es mostra és un bloc.

Vriullop (discussiócontribucions)

Ups, és guió mitjà (–), no guió llarg com deia més amunt. Prova de visualitzar <span lang="he" dir="rtl">1957–2001</span>.

Amadalvarez (discussiócontribucions)

Abans d'embogir amb certes característiques de RTL, hauríem de verificar com funcionarà amb la infobox local de la llengua RTL.

Provat el tema doble data. Miraré la plantilla que les munta a veure que li trobo.

Amire80 (discussiócontribucions)

Oh, and of course I should mention that in the Hebrew Wikipedia there are people who are doing something quite similar: Eran (@ערן), @IKhitron, and Bora Bora (@בורה בורה). I never looked deeply into their code, but I suspect that it's completely separate.

Eran, IKhitron, Bora Bora, a super-short summary of the discussion above: @Amadalvarez and other fine people in the Catalan Wikipedia are building a set of infobox templates that pull information from Wikidata and can be reused across wikis. They are testing it for RTL languages.

My take on this is: The Hebrew Wikipedia already has pretty good templates, but if template maintainers from different wikis work together, a lot of time can be saved. If I can get template maintainers to talk to each other, then I'm already successful. And if you can reuse each other's code, then it's even better.

Amire80 (discussiócontribucions)

(Also, Google Translate works quite well with the Catalan language ;)

IKhitron (discussiócontribucions)

But not with SD :-(.

בורה בורה (discussiócontribucions)

For now, I am just reading the conversation. Indeed most of our infoboxes are populated automatically from Wikidata. Another guy involved is @הנדב הנכון.

Amire80 (discussiócontribucions)

@בורה בורה, tip: to mention people, use "@", like on Facebook, Twitter, Telegram and a lot of other websites ;)

Vriullop (discussiócontribucions)

Some context. The module Wikidata on ca.wiki is currently used on eu.wiki and ast.wiki. With the experience of using it in other languages we are working in i18n for an easy and quick export. The target are small wikis with non techy users. Next ones are din.wiki and ga.wiki. Testing in Hebrew is just for identifying RTL issues for better i18n.

ערן (discussiócontribucions)

Most hewiki infoboxes use Wikidata using Module:Infobox which I wrote and behaves in somewhat similar approach to Russian wiki (and probably other wikis) allow template writers to "bind" values to Wikidata properties. such as

|label1=Birth place
|value1={{{Birth place}}}
|Birth place-Wikidata=P19

(it supports also more complex definitions such as multi-value, getting qualifiers etc - but this is probably out of scope of this topic)

  • English labels - In hewiki we don't pull English labels from Wikidata but rather add it to a category of missing translations. I understand different cultures/languages may have different choices here and it may not be an RTL specific issue
  • Birth date/place (@Amadalvarez) - We use similar infrastructure as rowiki (ro:Modul:LocationAndCountry). Given date+specific place, we can get the country. This is especially important in cases where the birth place is small settlement and the context of the country isn't known to common reader. Biographic infoboxes are quite common, so this is handled in he:יחידה:תבנית_מידע/אישיות. I think you may want to adapt the rowiki solution into cawiki infrastructure too :-)

regarding RTL issues with Catalan Wikdata infra: @Vriullop I suggest to make the module direction agnostic - probably can remove text-align on the value (td) as it isn't required, and for the th it may be possible to override it with css class in Common.css - this is probably better anyway, as the overall html code will be shorter. (caution: be sure the css is loaded in mobile or other platforms). Another solution is text-align:start. Replacing all left/right when adapting the code to other wiki would make it harder to update the module later.

Amadalvarez (discussiócontribucions)

Thank, @ערן. I answer some comments. For some others, @Vriullop is who knows how it runs.

  • English labels: To get the label and other text (as headers) within infobox we are using a template than: 1) look the ID in the exception list it contains for the language and 2) if no exception, "getLabel" from WD in the language. The exception list may have several languages (it has a switch by language). However, while test time, we just have exceptions for CA and EN. The idea is to refine the WD labels as much as possible during test time and let for the installaton time the filling of the exception list for the specific language. So, the languages mistakes you see now are easy to fix when we move all the multilingual adaptations to production stage.
  • To detect and correct the not translated labels we want to show a pencil as it happens with data content, but it's not implemented yet.
  • Birth place: When parameters were only manual, the people used to use this format. However, anyone adapted the criteria in function of cultural aspects. The concept of "país (Q6256)" not allways match with "estat (Q7275)", as you know. So, when we installed WD access decided not show any complement behind birthplace. I'll take a glance the ro module and he:יחידה:תבנית_מידע/אישיות to see its options.
Resposta a «Algú que sàpiga àrab i/o hebreu ?»