dimarts, de gener 16, 2007

Sopa de mots

Dec patir una greu tecnologitis, perquè ja m'he posat al blog això del tag cloud, almenys per provar-ho. Com ja deuen saber alguns lectors, un tag cloud és, literalment, és un "núvol d'etiquetes" o un "núvol de paraules clau". Una espècie de sopa de lletres, que no és de lletres sinó de mots. Com això, que correspon a aquest blog:



Un tag cloud analitza els continguts d'un fil de subscripció (que pot ser el del teu propi blog), i n'extreu les paraules clau més freqüents i, en funció de les vegades que es repeteixen i - potser, no ho sé - de la popularitat que tenen al web, els dóna una ponderació, una mida de lletra i un color, i les mostra. En general, el resultat és un "núvol" de paraules clau de diferent mida i color, dins un quadre.

Abans que el TERMCAT decreti que tag cloud s'ha de dir tac claut, convindria que anéssim pensant com en direm. Per exemple:

Núvol d'etiquetes

Ja hi ha uns quants "núvol d'etiquetes" al Google. Avui són 120, que pertanyen només a quatre o cinc llocs web. Traducció literal de tag cloud. És la solució adoptada en espanyol (nube de etiquetas, amb 1,72 milions de pàgines).

Núvol de paraules clau

Potser més exacte, però també més llarg, és com ho diuen en francès: nuage de mots clefs, amb 370 pàgines.

Núvol de paraules/núvol de mots

Una etiqueta és més que una paraula, però descriu sens dubte l'aparença de l'invent. Inèdit al Google. És com ho diuen en alemany (wortwolke, amb 263.000 pàgines).

Les solucions anteriors tenen de quatre a sis sil·labes, i fot ràbia pensar que en anglès només els en calen dues. Com deia abans, el tag cloud sembla una sopa de lletres o, per què no, una compacta sopa de mots? Tal vegada perquè mot és poc usual al català col·loquial.

Els tag clouds no saben català

Veient el resultat brut que dóna la meva subscripció a Zoom Clouds, podríem dir que Zoom Clouds, definitivament, no sap català, perquè les paraules que més destaca són preposicions, articles i adjectius molt freqüents que no tenen cap significació pel què fa al contingut del blog. Aquí teniu la sopa de mots del meu blog sense posar cap filtre:



Com veieu, la paraula més ponderada és els, un article determinat irrellevant per al contingut del blog. Altres etiquetes del núvol són: aquest, anat, altres, fos, seva.

El resultat encara és més desconcertant al blog de Dareboy, on fa dos dies vaig capturar aquesta sopa de mots:



Els, tots, molt, aquest, sempre, pot, quan, quins, sols, seva: els mots irrellevants predominen completament. Em té intrigat la "caspa", que ja no és tan irrellevant...

En el cas de Zoom Clouds, això es pot arreglar, en part, posant totes aquestes paraules irrellevants en un filtre d'etiquetes no desitjades (amb un límit de 200). Cal recarregar la sopa i veure si apareixen noves paraules irrellevants, i afegir-les de nou al filtre. Jo ho he fet tres o quatre vegades. També es pot crear un filtre d'etiquetes volgudes, igualment amb un límit de 200. Això millora el resultat, si compareu la captura del resultat sense filtres del meu blog amb la sopa de mots de la primera captura o de la barra lateral, ja filtrada.

I si tenim etiquetes al blog?

Val a dir que el tag cloud de Zoom Clouds funciona relativament bé en un blog, com el meu, en què no es fan servir etiquetes ni categories per caracteritzar o classificar els apunts. La majoria de serveis de blogs tenen l'opció fer-ho. Jo no ho he fet, perquè, la veritat, no ho faig servir gaire quan visito altres blogs i, a més, em fa mandra etiquetar ara els 450 apunts que tinc acumulats. Suposo, i és un suposar, que si teniu els apunts etiquetats amb paraules clau, el resultat de la sopa de mots encara serà més satisfactori.

Amb una paraula (amb un tag), i com diria la meva àvia: ja no sé què arribaran a inventar...

10 comentaris:

Mus ha dit...

¿Palabras frecuentes? ¿Nube de frecuencias? ¿Nube de modas? ¿Sopa de frecuencias? ¿Nube terminológica? ¿Sopa palabreril?

Da igual: con casi dos millones de nubes de etiquetas, esto tan feo no hay quien lo evite. :( ¡Con lo poco que me gustan a mí las etiquetas!

Geococcyx ha dit...

I aviat tindrem milers de "núvols d'etiquetes" a la blogosfera catalana...

bandala ha dit...

Tengo el mismo problema con mi respectiva zoom cloud. No diría que no sabe catalán (en todo caso, tampoco sabe español). Más bien, no sabe discriminar lo relevante de lo irrelevante.
Petós.

lola ha dit...

El meu avi deia el mateix, però precedit d'un exclamatiu "Redéu".
Voto per "mots", és un mot que m'agrada molt, com la majoria de monosíl.labs catalans.

Lola

Geococcyx ha dit...

Bandala:
De fet va ser després de veure el núvol de mots al teu blog, que vaig decidir de provar-ho. Amb els dos filtres que hi pots afegir la cosa funciona més bé. Ves a "Filter" al teu compte d'aquest servei i posa "no se", "ya" i potser alguna altra paraula al filtre de mots no desitjats. Per cert, es diu "Petons" :). Petó --> Petons.
Salut!

Geococcyx ha dit...

Lola:
Si senyora, Redéu...! Jo tinc molt clar quin terme és el que més probablement triomfarà, però m'ho callo.

Per cert, Lola, si no ho has fet, revisa el teu correu que tens al blog per als lectors que es volen comunicar, perquè t'hi vaig deixar un missatge.
Salut!

lola ha dit...

He revisat el correu i no hi consta cap missatge teu, Geo. Hi ha una llarga llista de procedències estranyíssimes que esborro directament; propaganda, vaja. Torna-ho a provar, si us plau.

Lola

Geococcyx ha dit...

Lola: T'he tornat a escriure a lola_2004.... És una qüestió tècnica. Mira també a la carpeta de "Correu brossa" o amb un nom semblant, que de vegades hi van a parar els missatges. Salutacions

lola ha dit...

Ja t'he trobat i t'he contestat (crec). Gràcies.

Lola

bandala ha dit...

Jejeje... me halaga!
Benvingut al meu blog (como podrás ver, mi catalán adolece de muchas cosas, pero gracias a ti lo estoy remendando un poco).
Petons i salut!