Etiquetes meta “canonical” i “noindex”

Les etiquetes “canonical” i “noindex” són molt importants dins d’un lloc web; serveixen perquè siguem nosaltres els que decidim que pàgina s’indexa i qual no més de poder evitar penalitzacions per contingut duplicat amb l’etiqueta “canonical” l’objectiu és a dir al cercador qual és la pàgina principal i qual és una còpia menys important.

Comencem per explicar que és la una etiqueta meta

Una pàgina web en general està construïda en HTML bé directament per un programador o dinàmicament amb un gestor de continguts (CMS) com WordPress, Joomla o Drupal per exemple entre d’altres.

Tant si la pàgina web és construïda de forma estàtica o dinàmica la seva estructura és sempre la mateixa, es compon de 2 parts que van incloses entre tags html.

¿Què és un tag?

Un tag és un element (codi) tancat entre símbols de “menor que” <i “més gran que”> que atorga propietats al seu contingut tancat i és interpretat pels navegadors per oferir dades.

¿Què és un atribut?

Un atribut és una variable que ofereix diverses funcions a l’element d’un tag

Explicat així és una mica complicat d’entendre però no hi ha una forma senzilla d’explicar … i com un exemple és el millor professor som-hi:

Exemple d’un tag per escriure un paràgraf: <p>

Sembla complicat però és molt senzill … la p és un element per escriure un paràgraf i com veieu va tancat entre símbols de major i menor que; ara bé … ¿on acaba el paràgraf? Senzillament on li indiquem que acaba; Com? escrivint el mateix tag al final del paràgraf però en aquest cas amb una “barra” /

Exemple de tancament del paràgraf: </p>

Un cop explicat el que és un tag he de dir que hi ha tags que no tenen contingut entre l’obertura i el tancament i en aquest cas no cal escriure novament el tag de tancament, només cal posar la barra al final abans del “més gran que”

Exemple d’un tag d’imatge: <img src=”URL-de-la-imatge.jpg” />

En aquest cas no tanquem amb </img> perquè no hi ha contingut entre el “més gran que” de l’obertura i el “menor que” del tancament ”

Les etiquetes per els meta tags són d’aquest tipus i no requereixen de tancament </> però si necessiten un atribut

On ubicar els tags i els atributs dels elements

“Canonical” i “noindex” se situen dins de la capçalera de l’HTML, un html es compon de dues parts: la capçalera (head) i el cos (body); el contingut de la capçalera no és visible per a ens usuaris però ofereix informació als cercadors i és gairebé tan important com el contingut del body perquè és on especifiquem el títol de la nostra pàgina web, la descripció, els arxius javascript que cal carregar perquè la web funcioni i els estils per l’aspecte del contingut però a més de tot això també podem especificar si volem que aquesta pàgina sigui indexada pels cercadors o si volem que es indexi una altra pàgina amb més contingut en lloc d’una pàgina amb una extracte.
Atributs, etiquetes i elements "canonical" i "noindex"

Exemple d’un html:

<html>
  <head>
     .....
  </head>
  <body>
     .....
  </body>
</html>

Com veieu hi ha uns punts verds dins de la secció HEAD (capçalera) i és en aquest lloc on podem posar les etiquetes? Meta amb les etiquetes “noidex” en cas de no voler que es indexi una pàgina com ara la pàgina de Facebook que vam mostrar dins del nostre lloc web, la pàgina que fem servir per accedir a la secció d’administració de la web o simplement perquè no hem acabat el lloc web i no ens interessa que es indexi fins que estigui tot el contingut.

Per evitar que els cercadors indexin una pàgina web podem fer-ho inserint aquesta fita tag amb l’etiqueta “noindex”

<meta name="robots" content="noindex">

Si tenim 2 pàgines amb un contingut similar o igual els cercadors només indexaran d’elles i possiblement no sigui la que ens interessa, en aquests casos el millor és afegir un altre meta tag amb l’etiqueta “canonical” per indicar als cercadors quina és la que s’ha de indexar, d’aquesta manera som nosaltres els que decidim que pàgina es mostrarà en els resultats que llancen els cercadors als usuaris.

Per indicar que pàgina volem que es indexi pels cercadors hem d’utilitzar l’atribut “canonical” en un element <link> de la capçalera (secció head) de la pàgina que no és l’original en la qual s’indicarà la url original (d’aquest manera més també ens evitem problemes de penalitzacions per contingut duplicat)

Exemple de l’element link amb l’atribut rel=”canonical” :

<link rel="canonical" href="url-original-que-se-debe-indexar" />

Sintaxi

Tag que necessita tancament:

<element-atribut="etiqueta o url">contingut</element>

Tag que no necessita tancament:

<element-atribut="etiqueta o url" atribut="etiqueta o url" />

Sabies que …

Un element pot contenir diversos elements i diversos atributs?