Enlace a facebook.
digitalDot diseño webLogo Diseño Web digitalDot

Robots.txt en WordPress para mejorar la seguridad y el SEO

Ficheros robot.txt
Escrito por Digitaldot
22 de agosto de 2020
Tiempo de lectura 6 min

Ficheros robot.txt

En digitalDot hemos querido tratar este punto del posicionamiento y factor de seguridad porque recientemente todas las auditorías de SEO que nos han llegado, tenían el fichero robots.txt, sin atribuir.

En nuestra agencia siempre intervenían, por un lado, nuestro consultor SEO que detectaba el fallo mediante una auditoría del tipo de contenido de la web y nuestro técnico de sistemas que lo implementaba y aportaba, de paso, las mejoras en seguridad web.

Por ello nos hemos embarcado en explicar la potencia que nos puede brindar el robots.txt en, por ejemplo, un WordPress.

¿Qué es el fichero Robots.txt?

Es un fichero txt que informa a arañas y buscadores si está permitida la rastreabilidad de una web, sobre que contenido, que velocidad y en que URLs puede navegar.

Este simple ficherito en txt tiene bastante potencia para nuestra página web.

Si nos sirve para restringir la parte de seguridad la tenemos clara, podemos bloquear aquellos robots que hagan uso de este fichero evitando rastreos o consumo de tráfico innecesarios para nuestro servidor Web y especificar el factor de la velocidad que queremos otorgarle.

¿Qué podría mejorar en seo el fichero Robot.txt?

Un punto importante para cualquier web es el sitemap, uno o varios ficheros que muestran la estructura jerárquica que posteriormente enviaremos a los buscadores.

¿Qué permite incluir el sitemap de una web? Sencillo, toda la información relevante de indexar para que los buscadores la encuentren, como las fotografías y la fecha de modificación, el contenido, rutas html de páginas, blogs, categorías que queramos indexar, etc.

Como consultores SEO debemos saber que las arañas, el primer fichero que rastrean, es el robots.txt por ello es tan importante prestarle atención, porque a través de él marcaremos la hoja de ruta para nuestra web.

Imaginad una tienda online con miles de páginas, con fichas de producto sin completar. Nuestra redacción de contenido puede tardar en completar toda esa información, por ello, podemos bloquear el rastreo o indexación y activar solo aquellas fichas de producto y categorías completamente trabajadas en factores SEO.

Si le facilitas el trabajo de rastreo de tu web a #Google mejorará tu posicionamiento ❤️ Compartir en X

¿Cómo podemos generar el robots.txt?

Desde digitalDot tenemos dos predilecciones. La primera es generarlo con Yoast SEO o Rank Math PLugin SEO WordPress, no conoces este último plugin, empieza ya a disfrutar de sus grandes ventajas, el plugin de SEO que desbancó a Yoast desde 2019.

Estos dos Plugins para WordPress son de los mejores en cuanto a factores de SEO aparte de poder generar nuestro fichero txt con editor de texto.

Sitemap en Robot.txt con Rank Math

Sitemap: https://www.digitaldot.es/sitemap_index.xml

Sitemap Rank Math Plugin SEO

¿Errores de SEO que podemos evitar con el fichero Robots.txt?

Si estamos en desarrollo o con la redacción de contenidos, o hemos instalado una demo a nuestro cliente, lo primero que querremos es que esos Lorem Ipsum o textos de prueba que no son definitivos, no lleguen a los buscadores.

En alguna ocasión se han montado web de demostración y aunque tenían el acceso limitado por el htaccess hemos visto como Google ha indexado una URL de preproducción por lo que no está de más bloquearlos desde este punto para evitar errores de textos duplicados.

User-agent: *
Disallow: /

*Recordad que, si esto os ocurre, desde la herramienta de Webmaster de Google podremos solicitar la desindexación de dominios o de páginas concretas, recientemente lo tuvimos que hacer para una página web y se solucionó en menos de 24 Horas.

¿Qué variables admite el fichero robot.txt?

  • User-agent: Aquí indicamos el motor sobre el que aplicamos las reglas de permitir o denegar (Disallow y allow). Un listado actualizado para usar en este parámetro lo tenéis en el siguiente enlace: Robotstxt.org
  • Disallow: Es el permiso más restrictivo, evita que la araña rastree todas las indicaciones posteriores.
  • Allow: Actúa como un "cortafuegos". Las reglas deben ser siempre restrictivas, por eso denegamos y luego podemos ir añadiendo nuestras excepciones mediante el comando allow (permitir).
  • Crawl-delay: Podemos indicar en segundos el tiempo de rastreo de las arañas entre paginas ideal si tenemos un hosting o servidor compartido y no queremos que google nos encuentre algún error 500 por sobrecarga.

¿Puede el robots.txt mejorar la seguridad de nuestra web?

Podemos evitar que nos rastreen ciertas zonas como el wp-admin o URLs que queremos proteger que se filtren contenido. Debemos tener en cuenta que es una falsa sensación de seguridad, ya que no rastrear no quiere decir que no se pueda acceder.

Que una URL no se pueda rastrear no quiere decir que no se pueda acceder. #palabradedigitalDot ? Compartir en X

Un error muy común de los administradores de sistemas o de los gestores es dejar copias en la carpeta raíz de nuestro sitio web, si permitimos el rastreo de cierto tipo de contenidos las arañas podrían localizar y mostrar nuestra base de datos y contraseñas o nuestros clientes suscriptos. Un fallo muy grave de seguridad.

Ejemplo de bloqueos de tipos de archivo y URLs:

Disallow: /wp-
Disallow: /wp-content/
Disallow: /trackback/
Disallow: /wp-admin/
Disallow: /feed/
Disallow: /?s=
Disallow: /search
Disallow: /archives/
Disallow: /index.php
Disallow: /*?
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: */feed/
Disallow: */trackback/
Disallow: /page/
Disallow: /tag/
Disallow: /category/
 
# No indexar copias de seguridad
Disallow: /*.sql$
Disallow: /*.zip
Disallow: /*.7zip
Disallow: /*.tgz$
Disallow: /*.gz$
Disallow: /*.tar$
Disallow: /*.svn$

Quieres conseguir un robots.txt adaptado a tu sitio pregunta a nuestros consultores SEO.

, , ,

Noticias relacionadas sobre Posicionamiento web

Caso de éxito SEO de tienda de detalles

Caso de éxito SEO de una tienda online de detalles para eventos

Vamos a contaros el caso de una tienda online, que contacto con nuestro equipo de marketing digital, porque tiene un comportamiento claramente estacional, donde los meses de mayor actividad (de febrero a mayo) concentran buena parte de las ventas del año y necesitaban optimizar la web para estar bien posicionada…

Riesgo crítico en servidores Linux

CVE-2026-31431: Vulnerabilidad crítica en el kernel de Linux. Guía de mitigación para hosting

En los últimos días se ha hecho pública una vulnerabilidad crítica en el kernel de Linux, identificada como CVE-2026-31431, que afecta a múltiples distribuciones ampliamente utilizadas como Debian, Ubuntu y otras derivadas. Se trata de un fallo de escalada de privilegios local (LPE) que permite a un usuario con permisos…

Módulo slider responsive para PrestaShop

Módulo slider responsive para PrestaShop

Con la actual crisis, sabemos que muchos habéis optado por el lanzamiento de vuestra tienda online, y habéis apostado por Prestashop como la mejor opción para gestor CMS de vuestra tienda.   En esta ocasión y con los recientes avisos por parte de Google, queremos informaros a todos los que…

Verifactu para WooCommerce y WordPress, cumple con la normativa AEAT

Verifactu para WooCommerce y WordPress, cumple con la normativa AEAT

Tras el éxito con más de 50 tiendas PrestaShop, digitalDot lanza su plugin especializado para WordPress y WooCommerce, llevando su solución de cumplimiento con la normativa AEAT a la plataforma más utilizada. Con esta herramienta, puedes cumplir con la ley de manera sencilla, sin suscripciones mensuales ni costes extras por…

AI Overviews y AI mode

AI Overviews y AI Mode: por qué tu web puede seguir posicionando pero recibir menos clics

Hubo un tiempo en el que mirar el posicionamiento en Google y mirar los clics era casi la misma película. Si subías posiciones, subían las visitas. Si entrabas en primera página, había premio. No era un sistema perfecto, pero al menos la lógica general se entendía. Ahora la cosa se…

Cómo gestionar miles de categorías en PrestaShop sin afectar el rendimiento

Cómo gestionar miles de categorías en PrestaShop sin afectar el rendimiento

En tiendas online con miles de categorías, como recambios o despieces, PrestaShop puede convertirse en un cuello de botella. No es un problema puntual, sino estructural cuando el árbol de categorías es muy grande o profundo. Según referencias públicas en GitHub y foros oficiales de PrestaShop, este comportamiento ya ha…

Cómo crear una ficha de productos para tiendas online

Cómo crear una ficha de producto para tu ecommerce

Hay fichas de producto que parecen escritas para cumplir expediente. Y luego están las que venden.La diferencia no está en “poner más texto” ni en añadir tres iconos de envío gratis y cruzar los dedos. Está en algo mucho más complejo: entender por qué alguien compra y traducirlo en una…

Errores SEO

8 errores comunes en SEO y cómo evitarlos

Antes de empezar por los errores te voy a contar por qué estos errores puede que te estén quitando tráfico (y, lo que es más trágico: ¡¡ventas!!) Muchos proyectos tienen el mismo problema: Si el SEO fuese un cubo, no es que no estén echando agua en él (contenido, enlaces,…

Auditoria SEO técnica en PrestaShop para un ecommerce

Auditoría SEO técnica en un Prestashop B2B con más de 10.000 productos

En digitalDot, como agencia especializada en SEO técnico, SEM y desarrollo ecommerce, vemos un patrón que se repite en tiendas B2B construidas sobre Prestashop: “Invertimos en marketing digital, tenemos catálogo, hacemos campañas… pero las ventas no crecen como deberían.” En este caso analizamos un ecommerce B2B de equipamiento para hostelería…

1 2 3 23
crossmenuchevron-down