Hacemos Blogging como recurso educativo para un aprendizaje colaborativo

Genere su Propio Sitemap

>> domingo, 13 de junio de 2010


El posicionamiento en buscadores de nuestros Sitios Web tiene una enorme importancia, ya que de él depende nuestro éxito o fracaso. Un requisito básico para que todo ese empeño valga la pena es lograr que todas las páginas de nuestro Sitio Web estén correctamente indexadas y las Crawlers (arañas) de los buscadores importantes visiten e indexen nuestras páginas con regularidad.
Asimismo, es importante proporcionar a los buscadores una “lista” de las páginas que nos interesan y cómo queremos que sean mostradas. Para ello, requerimos generar nuestro propio Sitemap o Mapa de Sitio, el cual es un archivo en formato  XML que contiene una lista de todas nuestras páginas, junto con alguna información adicional, como puede ser; La frecuencia con la que nuestra página cambia sus contenidos, cuándo fue la última vez que se actualizó y qué tan importante es respecto a las demás páginas.
La construcción del archivo Sitemap.XML debe tener ciertas características que le describo a continuación:

 

Contenidos obligatorios del Sitemap


Los valores de los datos deben utilizar códigos de escape para ciertos caracteres especiales, tal como se acostumbra en HTML.
Por ejemplo, las comillas dobles (") deben ser reemplazadas por " y los signos menor (<) y mayor (>) por < y > respectivamente.

 

El archivo XML debe:


·         Comenzar con una etiqueta de apertura y terminar con una de cierre
·         Especificar el protocolo estándar al que responde dentro de la etiqueta de apertura (ver en el ejemplo)
·         Incluir una entrada por cada dirección URL (que corresponderá a cada una de las páginas de nuestro sitio) como nodo XML padre.
·         Incluir un nodo XML hijo para cada dirección URL (cada nodo XML padre ).

Resumiendo estos aspectos en el siguiente ejemplo (sitio con dos páginas):







Contenidos opcionales del Sitemap

Cada nodo padre puede contener (además del nodo hijo obligatorio) cierta información adicional útil para que el proceso de indexación se realice más inteligentemente. Los nodos opcionales, aunque menos importantes, son:

Fecha


Se refiere a la fecha de la última modificación de la página que figura en
Esta fecha debe expresarse en formado AAAA-MM-DD, por lo que el 8 de julio de 2006 será 2006-07-08.

 

Frec

Se refiere a qué tan a menudo cambia la página que aparece en y será un dato que indicará a la “araña” con qué frecuencia volver a visitar nuestro sitio. Es un valor orientativo, por lo que no requiere que sea forzoso ponerlo.
Frec puede tomar alguno de los siguientes valores: always (siempre, para páginas que cambian cada vez que se muestran. Típicamente, las dinámicas), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensualmente), yearly (anualmente) o never (nunca, típicamente para páginas archivadas).

Valor

Se refiere a la importancia que tiene la página que figura en respecto de las demás que componen el sitio.
Volviendo al ejemplo anterior y agregando los atributos opcionales antes mencionados, se verá de la siguiente forma:





El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él.

Por ejemplo, si ubicamos el archivo sitemap.xml en el directorio ejemplo.com/catalogo/ no podrá incluir URLs que se encuentren en ejemplo.com/

Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en la raiz de nuestro Web Site o Blog
A partir de este punto solo queda enviar el Sitemap a los buscadores, que generalmente disponen de una página específica para aceptarlo.


Especificación de la ubicación del Sitemap en el archivo robots.txt

Puede especificar la ubicación del Sitemap utilizando un archivo robots.txt. Para ello, tan solo tiene que añadir la línea siguiente:
Sitemap: http://www.SuWebSite.com/sitemap.xml
Esta directiva es independiente de la línea User-agent de modo que no tiene importancia el lugar en que se coloca en el archivo. Si tiene un archivo de índice de Sitemap, puede incluir la ubicación únicamente de este archivo.
No es necesario que enumere todos los Sitemaps individuales en el archivo de índice.
Puede especificar más de un archivo de Sitemap por un archivo robots.txt.
Sitemap: http://www. SuWebSite.com/sitemap-host1.xml
Sitemap: http://www. SuWebSite.com/sitemap-host2.xml

Feed de distribución

Puede proporcionar feeds RSS (Real Simple Syndication) 2.0 o Atom 0.3 o 1.0. Por lo general, si su sitio ya cuenta con un feed de distribución, utilizará únicamente este formato. Tenga presente que este método puede que no permita a los motores de búsqueda conocer todas las URL de su Sitio, ya que el feed puede que sólo proporcione información sobre las URL recientes, no obstante, los motores de búsqueda pueden utilizar esta información para averiguar sobre otras páginas del sitio durante los procesos normales de rastreo, siguiendo los enlaces internos de las páginas del feed.
Asegúrese de que el feed se encuentre en el directorio de nivel más alto que desea que rastreen los motores de búsqueda.
Exclusión de contenido
El protolo Sitemap permite indicar a los motores de búsqueda qué contenido se quiere indexar. Sin embargo, para indicar a los motores de búsqueda el contenido que no quiere indexar, utilice un archivo robots.txt o la etiqueta meta. Para obtener más información sobre cómo excluir contenido de los motores de búsqueda, visite la página robotstxt.org.
Una buena herramienta para crear el Sitemap de su WebSite o Blog, visite el siguiente Sitio: Generar Sitemap
A través de Google Webmaster Tools y Yahoo Site Explorer podemos proporcionar la información de nuestro Sitemap a los buscadores.

1 comentarios:

Lucky6806 14 de agosto de 2010, 8:11  
Este comentario ha sido eliminado por el autor.

Publicar un comentario

  © Blogger template Simple n' Sweet by Ourblogtemplates.com 2009

Back to TOP