Enlace a facebook.
digitalDot diseño webLogo Diseño Web digitalDot

Robots.txt en WordPress para mejorar la seguridad y el SEO

Ficheros robot.txt
Escrito por Digitaldot
22 de agosto de 2020
Tiempo de lectura 6 min

Ficheros robot.txt

En digitalDot hemos querido tratar este punto del posicionamiento y factor de seguridad porque recientemente todas las auditorías de SEO que nos han llegado, tenían el fichero robots.txt, sin atribuir.

En nuestra agencia siempre intervenían, por un lado, nuestro consultor SEO que detectaba el fallo mediante una auditoría del tipo de contenido de la web y nuestro técnico de sistemas que lo implementaba y aportaba, de paso, las mejoras en seguridad web.

Por ello nos hemos embarcado en explicar la potencia que nos puede brindar el robots.txt en, por ejemplo, un WordPress.

¿Qué es el fichero Robots.txt?

Es un fichero txt que informa a arañas y buscadores si está permitida la rastreabilidad de una web, sobre que contenido, que velocidad y en que URLs puede navegar.

Este simple ficherito en txt tiene bastante potencia para nuestra página web.

Si nos sirve para restringir la parte de seguridad la tenemos clara, podemos bloquear aquellos robots que hagan uso de este fichero evitando rastreos o consumo de tráfico innecesarios para nuestro servidor Web y especificar el factor de la velocidad que queremos otorgarle.

¿Qué podría mejorar en seo el fichero Robot.txt?

Un punto importante para cualquier web es el sitemap, uno o varios ficheros que muestran la estructura jerárquica que posteriormente enviaremos a los buscadores.

¿Qué permite incluir el sitemap de una web? Sencillo, toda la información relevante de indexar para que los buscadores la encuentren, como las fotografías y la fecha de modificación, el contenido, rutas html de páginas, blogs, categorías que queramos indexar, etc.

Como consultores SEO debemos saber que las arañas, el primer fichero que rastrean, es el robots.txt por ello es tan importante prestarle atención, porque a través de él marcaremos la hoja de ruta para nuestra web.

Imaginad una tienda online con miles de páginas, con fichas de producto sin completar. Nuestra redacción de contenido puede tardar en completar toda esa información, por ello, podemos bloquear el rastreo o indexación y activar solo aquellas fichas de producto y categorías completamente trabajadas en factores SEO.

Si le facilitas el trabajo de rastreo de tu web a #Google mejorará tu posicionamiento ❤️ Compartir en X

¿Cómo podemos generar el robots.txt?

Desde digitalDot tenemos dos predilecciones. La primera es generarlo con Yoast SEO o Rank Math PLugin SEO WordPress, no conoces este último plugin, empieza ya a disfrutar de sus grandes ventajas, el plugin de SEO que desbancó a Yoast desde 2019.

Estos dos Plugins para WordPress son de los mejores en cuanto a factores de SEO aparte de poder generar nuestro fichero txt con editor de texto.

Sitemap en Robot.txt con Rank Math

Sitemap: https://www.digitaldot.es/sitemap_index.xml

Sitemap Rank Math Plugin SEO

¿Errores de SEO que podemos evitar con el fichero Robots.txt?

Si estamos en desarrollo o con la redacción de contenidos, o hemos instalado una demo a nuestro cliente, lo primero que querremos es que esos Lorem Ipsum o textos de prueba que no son definitivos, no lleguen a los buscadores.

En alguna ocasión se han montado web de demostración y aunque tenían el acceso limitado por el htaccess hemos visto como Google ha indexado una URL de preproducción por lo que no está de más bloquearlos desde este punto para evitar errores de textos duplicados.

User-agent: *
Disallow: /

*Recordad que, si esto os ocurre, desde la herramienta de Webmaster de Google podremos solicitar la desindexación de dominios o de páginas concretas, recientemente lo tuvimos que hacer para una página web y se solucionó en menos de 24 Horas.

¿Qué variables admite el fichero robot.txt?

  • User-agent: Aquí indicamos el motor sobre el que aplicamos las reglas de permitir o denegar (Disallow y allow). Un listado actualizado para usar en este parámetro lo tenéis en el siguiente enlace: Robotstxt.org
  • Disallow: Es el permiso más restrictivo, evita que la araña rastree todas las indicaciones posteriores.
  • Allow: Actúa como un "cortafuegos". Las reglas deben ser siempre restrictivas, por eso denegamos y luego podemos ir añadiendo nuestras excepciones mediante el comando allow (permitir).
  • Crawl-delay: Podemos indicar en segundos el tiempo de rastreo de las arañas entre paginas ideal si tenemos un hosting o servidor compartido y no queremos que google nos encuentre algún error 500 por sobrecarga.

¿Puede el robots.txt mejorar la seguridad de nuestra web?

Podemos evitar que nos rastreen ciertas zonas como el wp-admin o URLs que queremos proteger que se filtren contenido. Debemos tener en cuenta que es una falsa sensación de seguridad, ya que no rastrear no quiere decir que no se pueda acceder.

Que una URL no se pueda rastrear no quiere decir que no se pueda acceder. #palabradedigitalDot ? Compartir en X

Un error muy común de los administradores de sistemas o de los gestores es dejar copias en la carpeta raíz de nuestro sitio web, si permitimos el rastreo de cierto tipo de contenidos las arañas podrían localizar y mostrar nuestra base de datos y contraseñas o nuestros clientes suscriptos. Un fallo muy grave de seguridad.

Ejemplo de bloqueos de tipos de archivo y URLs:

Disallow: /wp-
Disallow: /wp-content/
Disallow: /trackback/
Disallow: /wp-admin/
Disallow: /feed/
Disallow: /?s=
Disallow: /search
Disallow: /archives/
Disallow: /index.php
Disallow: /*?
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: */feed/
Disallow: */trackback/
Disallow: /page/
Disallow: /tag/
Disallow: /category/
 
# No indexar copias de seguridad
Disallow: /*.sql$
Disallow: /*.zip
Disallow: /*.7zip
Disallow: /*.tgz$
Disallow: /*.gz$
Disallow: /*.tar$
Disallow: /*.svn$

Quieres conseguir un robots.txt adaptado a tu sitio pregunta a nuestros consultores SEO.

, , ,

Noticias relacionadas sobre Posicionamiento web

Usar Search Console para posicionar

Cómo usar Search Console para mejorar tu posicionamiento web

Si tienes una web pero no sabes cómo te va en Google, es muy probable que necesites conocer esta herramienta: Google Search Console.Search Console es, básicamente, el lugar donde Google te deja ver qué está pasando entre tu web y el buscador: Por qué búsquedas apareces. Qué páginas atraen clics…

Caso de éxito tienda online atún

Caso de éxito SEO y SEM: tienda online de sobres de atún

Una empresa consolidada del sector de las conservas premium decidió lanzar una nueva web independiente para vender un producto muy concreto: sobres de atún. Aunque la marca contaba con experiencia en el sector, este nuevo proyecto digital partía desde cero: nueva web, nuevo dominio, sin visibilidad en Google y sin…

WooCommecre vs PrestaShop

WooCommerce vs PrestaShop ¿Qué eCommerce es mejor? Guía completa

Si estás pensando en montar una tienda online, seguro que ya te han dicho eso de: “Hazla con WordPress y WooCommerce, que es gratis y sirve para todo”. Suena genial… hasta que empiezas a crecer, metes más productos, varios idiomas, filtros, integraciones y de repente tu tienda va más lenta…

digitalDot Partner de Klaviyo

Klaviyo: Plataforma para automatización de marketing digital

Si tienes una tienda online, seguro que te suena esta película: inviertes en tráfico, la gente entra, mira, añade al carrito… y desaparece. O compra una vez y no vuelve. Y mientras tanto, tú mandas algún newsletter suelto de vez en cuando, con un cupón y “a ver si cuela”.…

Google Core Update: todas las novedades de SEO

Google Core Update 2025: Todas las novedades en SEO en detalle

Google ha vuelto a poner en marcha su maquinaria de actualizaciones de algoritmo, y la comunidad SEO está atenta a los cambios que esto implica. En el año 2023, Google ha lanzado cuatro actualizaciones de núcleo, en marzo, agosto, octubre y noviembre. Aunque Google no proporciona detalles específicos sobre los…

Neuromarketing en Marketing Digital. digitalDot

Qué es el neuromarketing y cómo aplicarlo al marketing digital

Seguro que en los últimos años te has cruzado cientos de veces con la palabra neuromarketing. Y probablemente has pensado algo tipo: “Vale, esto suena a ciencia muy seria… o a vendehúmos muy creativos”. La realidad está justo en medio: el neuromarketing no es magia ni humo, pero tampoco necesitas…

Cómo configurar el seguimiento de conversiones en WooCommerce con Google Analytics 4

Cómo configurar el seguimiento de conversiones en WooCommerce con Google Analytics 4 (GA4)

¿Tienes una tienda online?, ¿la tienes con WooCommerce?, pues este artículo es para ti porque en él vas a aprender a instalar y configurar el plugin Enhanced Ecommerce Google Analytics Plugin for WooCommerce. ¿Y, para qué sirve te preguntarás?, pues se trata de un plugin que te permitirá habilitar el…

Actualizar Prestashop últimas versiones importancia

No actualizar PrestaShop puede hundir tu negocio de la noche a la mañana

¿Crees que tu tienda online está a salvo solo porque “nunca te ha pasado nada”? Pues siento decirte que los hackers adoran a los que piensan así. Si tu Prestashop sigue en versiones antiguas (1.6, 1.7 o incluso una 8 sin actualizar), estás dejando la puerta abierta… y ni siquiera…

Métricas esenciales en marketing. Google Analytics 4 y Search Console

Google Analytics 4 y Search Console: Guía de métricas en marketing

Te advierto, este no es un artículo para leer en 5 minutos, es un artículo para aprender y para hacer de ti un “top” en marketing o, si eres dueño de una web, para conseguir los datos necesarios para tomar decisiones objetivas para tu negocio online.Señoras, señores, el “tostón”, perdón,…

1 2 3 23
crossmenuchevron-down