La primera vez que verifiqué lo que Google tenía indexado de mi Web me quedé horrorizado. Ejecuté site:andreso.net y vi que todas mis páginas de contenido tenían el id de sesión en la URL. Esto significa que la parte final de los enlaces que almacenaba el buscador contenían algo como &PHPSESSID=A53cdp1sst2rev. Ese identificador de sesión es diferente para cada visitante. Al visitar una página varias veces y ver que los enlaces son distintos pero que el contenido es el mismo los buscadores te castigan. Los buscadores detestan el contenido duplicado.
Lo peor de todo fue la galería de fotos que instalé. La primera vez que me conecté al panel de administración de la galería vi que tenía la opción de mostrar los mensajes internos en varios idiomas. Además existía la posibilidad, pulsando un simple enlace, de cambiar el lenguaje en el que se muestran estos mensajes. Lo activé. En cada página de mi galería había una cabecera con la bandera más representativa de cada lenguaje. Pulsando a esa bandera se cambiaba el leguaje.
Google encontró los enlaces de los distintos lenguajes. Cuando un buscador analiza una página, va apuntando todos los enlaces para visitarlos luego. Guarda una lista de todos los enlaces que aparecen y va visitándolas de una en una. Si hubiese más enlaces, los agregaría a la lista. Google había conseguido enlaces de las páginas de mi galería de fotos en muchos idiomas. Visitaba toda la galería en cada uno y todos de los idiomas que tengo.
La primera medida que tomé fue modificar la galería para que en las cabeceras informase a los buscadores que no quería que estas páginas se indexasen. No funcionó. Verificando mi Web en Google veo que casi todas las páginas almacenadas son unas pocas páginas de la galería en distintos idiomas. Lo que me interesa que aparezca, lo que escribo en este página, no está en la lista.
Hay un fichero llamado robots.txt que lista las páginas y carpetas que se quiere evitar que aparezcan en los buscadores. He añadido la galería de fotos a este fichero. Además he cambiado el programa que muestra mi Web. Ahora tengo enlaces bonitos, sin parámetros, en todo mi contenido. Me he apuntado a un servicio de Google que muestra como el buscador ve mi Web. Según este servicio el 80% de todas mis páginas están
en chino. Los efectos colaterales de permitir mostrar una interfaz en varios idiomas. El primer enlace de mi página principal apuntaba a la galería de fotos. El primer enlace de la galería de fotos era para mostrar el interfaz en chino. También tenía páginas en coreano y turco.
Ya llevo casi medio año intentando solucionar el problema que mi poco conocimiento del funcionamiento de los buscadores causo. Lo último que he hecho es mover mi galería de fotos de sitio. A ver si eso funciona.
Para evitar mostrar páginas basura, Google mantiene las Web poco importantes, como la mía, en cuarentena. Lo llaman The Google Sandbox. Dicen que pasados varios meses ya sales de la cuarentena. Yo todavía estoy ahí. Ningún artículo de los que he escrito desde que cambié el software del portal están listados. Está claro que sin los buscadores no voy a conseguir que nadie lea lo que escribo.
Andreso