Eliminar página o URL indexada en Google

Existe un gran desconocimiento sobre cómo podemos hacer que nuestra página web o una URL de la misma sea desindexada correctamente de Google.

Disponer únicamente de páginas de calidad es un Factor SEO crítico para cualquier estrategia. Por ello debemos evitar que los buscadores indexen aquellas que no aportan valor.

Prevenir que se indexe

  • Directiva noindex
  • Bloqueo con disallow en robots.txt (no garantiza la no indexación)

Eliminar URL indexada

  • Error 404 o 410
  • Redirección 301
  • Herramienta de eliminación de Google (temporal) + noindex/disallow

1. Prevenir la indexación de una URL

Si aún estamos a tiempo, es mejor prevenir la indexación de nuestra página o sección por parte de los buscadores.

1.1. Directiva noindex

Para poder utilizar noindex dentro de una URL, ésta debe ser accesible por los buscadores por lo que no podemos bloquear su acceso a través del robots.txt

La directiva noindex puede ser implementada a través del header de la página:

<!DOCTYPE html>
<html><head>
<meta name="robots" content="noindex" />
_(…)_
</head>
<body>_(…)_</body>
</html>

O también como respuesta a una cabecera HTTP

X-Robots-Tag: noindex

De esta forma le indicamos a los buscadores que no queremos que dichas URLs sean indexadas.

La directiva noindex bajo robots.txt, es algo experimental y puede que en un futuro desaparezca por lo que no es recomendable utilizarla.

1.2. Disallow en robots.txt

El fichero robots.txt podría ser ignorado por los buscadores por lo que no es una opción que garantice al 100% la no indexación de la URL.

En el caso de que se trate de una sección amplia del sitio o que no tengamos acceso a dichas páginas para poder implementar la directiva noindex, podemos hacer uso del comando disallow del robots.txt. Para ello debemos seguir el estándar de exclusión de robots.

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /privado/

2. Eliminar una URL ya indexada

En el caso de que la URL esté indexada por los buscadores, además de seguir los pasos del punto anterior, podemos hacer lo siguiente para acelerar y agilizar el proceso:

  1. Forzar un error 404 o error 410 (éste último suele ser más rápido)
  2. Aplicar una redirección 301 (suele generar un error 404 soft en Google Search Console)

Herramientas de Google

Google pone a nuestra disposición dos herramientas, la primera para poder eliminar contenido puntual desde Google Search Console y la segunda para eliminar contenido obsoleto. Ambas no garantizan su eliminación y, de hacerlo, se trata de una acción temporal por lo que tendrá validez únicamente durante 90 días. A partir de entonces, podría volver a ser indexado.

Consejos adicionales

En el caso de muchas URLs que, tras un tiempo publicadas, no queremos que sigan indexadas, podemos hacer uso de la etiqueta unavailable_after de tal forma que ya vamos preparando el terreno para que, a corto plazo, Google las desindexe. Yo la suelo utilizar para páginas de eventos.

En el caso de que queramos que desaparezca información alojada en otras páginas y que están incumpliendo las normas, podemos seguir estos pasos ya que debemos hacerlo a través del portal legal de Google.

Experto SEO

Especialista en estrategias digitales. #hablemos