Cómo Agregar un Archivo Txt de Robots a WordPress (En 3 Sencillos Pasos)
Publicado: 2022-09-21Agregar un archivo robots.txt a su sitio de WordPress es un proceso simple que se puede realizar en unos pocos pasos. Un archivo robots.txt es un archivo de texto que le dice a los rastreadores de motores de búsqueda qué páginas de su sitio web deben indexar y cuáles deben ignorar. Al excluir ciertas páginas de la indexación, puede mejorar la optimización del motor de búsqueda (SEO) de su sitio. Hay algunas formas diferentes de agregar un archivo robots.txt a WordPress. La forma más fácil es usar un complemento como Yoast SEO o All in One SEO Pack, que generará automáticamente un archivo robots.txt para usted. Alternativamente, puede crear un archivo robots.txt usted mismo y subirlo a su sitio de WordPress a través de FTP. Cualquiera que sea el método que elija, asegúrese de probar su archivo robots.txt antes de publicarlo para asegurarse de que funciona según lo previsto.
Obtener una presencia en los motores de búsqueda para palabras clave específicas es esencial para los propietarios de sitios web porque garantiza que su sitio aparezca en el SERP. Los webmasters pueden establecer la cantidad de tiempo que los robots de los motores de búsqueda pasan dentro y fuera de los sitios web insertando instrucciones en robots.txt, un archivo especial. En este tutorial, le mostraré cómo agregar un archivo 'robots.txt' a su sitio web de WordPress para evitar que los motores de búsqueda accedan a partes específicas de su sitio. Conéctese a la Plataforma Cloudways usando FileZilla. Puede crear un nuevo archivo llamado robots.txt en /applications/ [FOLDER NAME]/public_html. Abra el archivo en un editor de texto (el Bloc de notas es una buena alternativa). La configuración de comodines permite la descarga de ciertos tipos de archivos.
No hay límite para las opciones/selecciones que puede manejar un asterisco (*). Además, si se selecciona una extensión específica, puede limitar la cantidad de archivos que se pueden desactivar. Robots.txt es un archivo fantástico para usar para SEO propósitos. Depende de usted cuántas partes de su sitio de WordPress desea que aparezcan en SERP. Si su sitio tiene un mapa del sitio, debe incluir una URL para ayudar a los motores de búsqueda a ubicarlo. Con frecuencia, no es necesario indexar los directorios. por los motores de búsqueda Como resultado, una página puede indexarse mucho más rápido.
Como resultado, debe incluir robots.txt en los scripts de su sitio web para que los motores de búsqueda se abstengan de indexar ciertas partes. Si su sitio está configurado incorrectamente (como eliminar /), Google lo desindexará. También debes ser cauteloso. Tienes la oportunidad de completar la tarea. Dígame si utiliza este tipo de archivo y cuáles son sus configuraciones.
txt es uno de los formatos de archivo más simples de usar. Los robots están programados para "Permitir" (es decir, indexarlos) y "No permitirlos" (es decir, rechazarlos) según las páginas que deseen ver. Este último solo se usará una vez para enumerar las páginas en las que no desea que se rastreen las arañas.
Un sitio web puede usar un archivo de texto llamado txt para proporcionar instrucciones a los robots de rastreo web. Google y otros motores de búsqueda utilizan rastreadores web , también conocidos como robots web, para archivar y categorizar sitios web. Una búsqueda de robot se usa típicamente en los bots.
Robots.txt se puede agregar a un archivo en Internet. Para ver las directivas del sitio web (si el sitio tiene robots), envíe un mensaje de texto con la URL al final de cualquier dominio raíz.
¿Dónde pongo el archivo Robots Txt de WordPress?

Cree una lista de sus robots FTP yendo a la sección de la izquierda de su cliente FTP (estamos usando Filezilla). Guardó un archivo txt que creó previamente en su computadora. Puede cargarlo haciendo clic con el botón derecho y seleccionando Cargar. El archivo se cargará en unos momentos y podrá verlo en su directorio raíz de WordPress.
El archivo robots.txt se encuentra en su directorio raíz de WordPress y es un archivo de texto. Para dar a los robots de los motores de búsqueda una idea de qué páginas de su sitio web deben rastrear, muestra una lista de las páginas que deben y no deben rastrearse. Es posible indicarle al archivo que evite el rastreo, en lugar de la indexación. En los casos en que los bots maliciosos hayan corrompido su sitio web, es esencial un buen complemento de seguridad. WordPress crea un archivo virtual robots.txt para cada sitio web que lo usa. Si quieres cambiar algo, tienes tres opciones. El complemento Yoast SEO , una de las herramientas más populares para optimizar sitios web, es una excelente opción.
All in One SEO, otro complemento de SEO gratuito, ofrece una variedad de características adicionales. Si ha utilizado FTP anteriormente, sabe que puede cargar archivos robots.txt en su servidor. Verá una nueva sección en el archivo robots.txt llamada Robots.txt donde puede agregar reglas y directivas al archivo después. User-agent y Disallow son ambas directivas contenidas en este archivo. Si desea especificar un solo bot (por ejemplo, Bingbot), o si desea que las directivas se apliquen a todos los bots, ingrese un asterisco (User-agent: *). Las solicitudes de rastreo excesivas sobrecargan el servidor, lo que da como resultado que se utilice una directiva de retraso de rastreo. Debido a que no hay rastreadores que admitan esta directiva, es mejor usarla con precaución.
Los motores de búsqueda se dirigirán a su archivo de mapa de sitio XML si utiliza la directiva Sitemap. En las siguientes secciones, le mostraremos dos fragmentos de muestra que demuestran el uso de las directivas de robots.txt. Cada sitio de WordPress tiene un archivo robots.txt en su directorio raíz. En él, los rastreadores recibirán instrucciones sobre qué secciones de su sitio web deben buscar. Deberían, o no deberían, arrastrarse por el suelo. Durante nuestra discusión, cubrimos formas de crear una versión física del archivo y cómo editarlo.
¿Debe agregar un archivo Robots.txt a su sitio web de WordPress?
Tan pronto como se instale WordPress, generará automáticamente un archivo robots.txt. Un indexador de motores de búsqueda archiva este directorio para determinar qué páginas de un sitio están indexadas. Los archivos Robots.txt no necesitan agregarse a los sitios web de WordPress en la mayoría de los casos. Sin embargo, para aumentar su clasificación en los motores de búsqueda, puede agregar un archivo robots.txt para administrar el índice del motor de búsqueda.
¿Cómo abro un archivo Txt de Robots en WordPress?

Hay algunas formas de abrir un archivo robots.txt en WordPress. Una forma es simplemente ir a la carpeta de instalación de WordPress y abrir el archivo en un editor de texto. Otra forma es usar un complemento como WP Robots Txt para editar el archivo desde el área de administración de WordPress.
Hay un archivo robots.txt que se encuentra en casi todos los sitios web, pero la mayoría de las personas no entienden qué hace o cómo usarlo. En esta guía, veremos el archivo y sus restricciones para aprender a administrar el acceso a su sitio web. Incluso si una página tiene enlaces que apuntan a ella, los motores de búsqueda aún pueden indexarla si está bloqueada por robots.txt. Google no accederá a las áreas marcadas en su sitio. Se puede agregar una etiqueta noindex a una página que no ha sido bloqueada por Google, según John Mueller, analista de webmasters de Google. Puede usar el popular complemento Yoast SEO para crear (y luego editar) una plantilla de SEO. Coloque su archivo robots.txt en el lugar adecuado haciendo clic derecho en la interfaz de Yoast.
Del mismo modo, puede implementar este tipo de integración en el complemento All in One SEO. Siga leyendo para obtener más información sobre los diferentes tipos de directivas que deben especificarse en su archivo robots.html de WordPress. Antes de agregar reglas, primero debe seleccionar a qué agente de usuario se debe aplicar la regla, seguido de cuántas reglas se aplicarán usando Disallow y Allow. No permitir el acceso a una carpeta y sus carpetas secundarias pero permitir el acceso a la carpeta específica de un elemento secundario específico puede ser una buena idea si desea restringir el acceso a una carpeta y sus carpetas secundarias. Permitir le permite otorgar acceso a un archivo específico dentro de una carpeta específica, pero le impide acceder a una carpeta completa. WordPress usa un parámetro de consulta llamado?s= cuando maneja consultas. Solo necesita agregar la siguiente regla para configurar un bloqueo en el acceso.
Los errores suaves 404 también se pueden evitar usando esta función, así como bloqueándolos si ocurren. Incluso si está apuntando a una región específica fuera de los Estados Unidos, no es necesario bloquear el Googlebot para que no ingrese al país. A Google le irrita que no se entienda un comando con un carácter invisible. Es una pena que esto invalide la primera línea de nuestro archivo robots.txt. No es lo mismo que usar una etiqueta noindex en archivos robots.txt, que se denominan comandos Disallow. Bots.txt, por otro lado, no indexa, pero evita el rastreo. Puede usarlo para configurar cómo los motores de búsqueda y otros bots interactúan con su sitio web agregando reglas específicas. No es necesario cambiar el archivo virtual robots.html predeterminado para la mayoría de las personas que no usan WordPress en absoluto. Sin embargo, puede agregar sus propias reglas si tiene problemas con un bot o complemento específico.

Cómo agregar un archivo Robots.txt a su sitio
Si está utilizando WordPress, puede agregar fácilmente este archivo a su sitio mediante el asistente Agregar nueva página. Luego, en el campo URL del archivo, ingrese la URL del archivo robots.txt. Este archivo también se puede agregar a una página de WordPress haciendo clic en el elemento de menú Administrar páginas en el tablero.
Si no usa WordPress, es posible que deba agregar robots.txt a su sitio de una manera diferente. Si tiene un cliente FTP instalado en su computadora, puede agregar fácilmente este archivo; Si tiene un administrador de archivos instalado en su computadora, puede agregarlo fácilmente.
¿Necesito un archivo Robots Txt de WordPress?

No hay una respuesta definitiva a esta pregunta, ya que depende del sitio específico de WordPress en cuestión y del tipo de contenido o funcionalidad que tenga. En general, sin embargo, un archivo robots.txt no es estrictamente necesario para WordPress, aunque puede ser útil en algunos casos. Por ejemplo, si un sitio de WordPress tiene mucha información sensible o confidencial, se puede usar un archivo robots.txt para evitar que los motores de búsqueda indexen este contenido.
El archivo robots.txt es un archivo de texto simple que le dice a los motores de búsqueda dónde y cuándo no deben rastrear su sitio web. Puede evitar que los motores de búsqueda accedan a diferentes archivos y carpetas en su sitio utilizando esta función. En este artículo, le mostraremos cómo crear uno y le daremos algunos complementos que recomendamos, permitiéndole hacer el trabajo usted mismo. Cada motor de búsqueda incluye un agente de usuario de rastreo web en sus resultados de búsqueda. Googlebot, por ejemplo, indexa el contenido de su sitio web para el motor de búsqueda de Google. Tiene la opción de configurar una instrucción personalizada para cada uno de estos agentes de usuario. Se puede acceder al archivo robots.txt escribiendo '/robots.txt' después del nombre de dominio.
Puede indicarle al robot que no vea ninguna página en el sitio después de canjear la barra haciendo clic en el enlace. Un rastreo de presupuesto se define como la cantidad de URL que un robot de motor de búsqueda puede rastrear en una sesión. Cada sitio web tendrá un presupuesto de rastreo específico. Si tiene muchas páginas en su sitio web, debe verificar si el bot está rastreando primero sus páginas más valiosas. El complemento Yoast SEO de WordPress le permite crear fácilmente archivos robots.txt desde su tablero. Luego, use un cliente FTP como Filezilla para cargar el archivo manualmente. Si desea mostrar el archivo en su sitio web, asegúrese de que esté en la carpeta raíz.
Para crear uno, deberá usar un editor de texto como el Bloc de notas si el archivo no está allí. El archivo robots.txt siempre debe estar ubicado en la raíz de su sitio web. Los motores de búsqueda seguirán rastreando e indexando su sitio independientemente de si tiene este archivo o no. Es sencillo probar su archivo robots.txt en Google Search Console. Al hacer clic en "Agregar propiedad ahora", puede agregar su sitio web a la Búsqueda de Google en cuestión de minutos. Es fundamental mantener un presupuesto de rastreo específico en cada sitio web. Debe tener en cuenta la cantidad de páginas que un bot debe visitar durante una sesión. Si el bot no completa el rastreo de todas las páginas de su sitio durante la sesión, volverá a su sitio y reanudará el rastreo en la próxima sesión. Una solución rápida es bloquear los robots de búsqueda para que no rastreen páginas innecesarias, archivos multimedia, complementos, carpetas de temas, etc., ahorrando así su cuota de rastreo.
En pocas palabras, agregue la siguiente línea a su archivo robots.txt: Agentes: usuarios. El servicio Googlebot está actualmente en uso. Si no tiene un archivo robots.txt, Googlebot rastreará sus páginas y las indexará automáticamente en el motor de búsqueda.
Por qué debería agregar un archivo Robots.txt para mejorar su SEO
Puede aumentar la clasificación de su sitio web en los motores de búsqueda descargando un archivo robots.txt. Los rastreadores buscarán este archivo en la raíz de su sitio web para ver si el contenido está permitido o no y por qué.
Editar Robots.txt WordPress
Si desea editar su archivo robots.txt, puede hacerlo yendo a su panel de control de WordPress y luego haciendo clic en la pestaña "Configuración". Desde allí, encontrará la sección "Lectura" donde puede editar su archivo robots.txt.
Un archivo robots.txt, además de decirle a los motores de búsqueda a dónde puede ir su sitio, también les dice cómo rastrearlo. Si le indica a sus bots que no rastreen páginas innecesarias en su sitio, puede aumentar su velocidad de carga y posiblemente obtener una clasificación más alta en los motores de búsqueda. En esta publicación, le mostraremos cómo editar su archivo robots.html usando WordPress. El archivo robots.txt es necesario por algunas razones. Al usar una etiqueta meta noindex en lugar de robots.txt al cargar un sitio web. Por qué es tan importante en nuestras vidas. Si bien el sistema le permite especificar qué motores de búsqueda y otros bots interactúan con su sitio web, no prohíbe explícitamente que los motores de búsqueda u otros bots indexen su contenido.
Veamos cómo editar archivos robots.html en WordPress paso a paso usando AIOSEO. El generador de reglas le permite crear sus propias reglas para páginas específicas que los robots pueden visitar o no. Al crear una regla personalizada, puede ingresar el Agente de usuario (por ejemplo, el rastreador de Googlebot ) en el campo Agentes de usuario. Debe ingresar la ruta del directorio o el nombre del archivo en el campo Ruta del directorio después de determinar qué bots deben permitirse o denegarse. Si guarda sus nuevas reglas, estarán visibles en la sección Vista previa de Robots.txt. Puede ver su archivo robots.txt haciendo clic en Abrir robots. Este texto se enviará a su dispositivo móvil tan pronto como esté disponible. Simplemente escribiendo los detalles de sus reglas, puede modificarlas. En una sección separada se mostrarán algunos ejemplos de reglas de eliminación.
Robots.txt predeterminado para WordPress
Si crea un sitio de WordPress y no crea un archivo robots.txt personalizado, su sitio generará automáticamente un archivo robots.txt predeterminado que incluye lo siguiente: Agente de usuario: * No permitir: / La primera línea, Agente de usuario: * , se aplica a todos los rastreadores web . La segunda línea, Disallow: /, indica a todos los rastreadores web que no indexen ninguna página de su sitio. Esta es la configuración más restrictiva y no se recomienda para la mayoría de los sitios de WordPress.
El uso de un archivo robots.txt bien estructurado le permitirá dirigir los robots de los motores de búsqueda a su sitio web. Se les dice que mantengan la distancia de esas habitaciones mientras las miran. Incluso si no es un mago técnico, puede crear este archivo para satisfacer sus necesidades, incluso si no sabe nada de codificación. Cuando crea un sitio web de WordPress, crea un archivo virtual robots.txt para usted. Se impide que los bots accedan al administrador y WP incluye directorios basados en este archivo. Para realizar cambios, primero debe crear un nuevo archivo y luego cargarlo en la carpeta raíz. Robots.txt se puede editar en WordPress de dos maneras: a través de un complemento o manualmente.
Creamos un nuevo conjunto de reglas para evitar que el robot de búsqueda de Bing rastree nuestro sitio en este ejemplo. Es casi seguro que la mayoría de los bots seguirán sus instrucciones en este archivo, pero no está tratando de obligarlos a hacerlo. Una vez que haya instalado y activado el complemento Yoast SEO para WordPress, podrá editar archivos robots.txt directamente desde el panel de control de WordPress. El paquete de SEO todo en uno es el otro paquete de SEO a tener en cuenta cuando se trata de WordPress SEO , y también es muy fácil de usar. Yoast es un producto similar a este, pero es mucho más liviano. Es tan simple como escribir algunas líneas de texto en el Bloc de notas o en TextEdit para crear un archivo robots.txt. Para probar el archivo, cárguelo a través de FTP y luego use Google Search Console.
El paquete de SEO todo en uno incluye una herramienta que se puede usar para bloquear bots "malos". Si desea aumentar la visibilidad de su sitio, es fundamental que los robots de los motores de búsqueda rastreen la información más relevante. Los archivos robots.txt de WordPress simplifican la especificación de cómo sus bots interactúan con su sitio. Será más fácil para ellos presentar contenido relevante y útil a los motores de búsqueda.
Cómo actualizar su archivo Robots.txt de WordPress
Si la raíz del sitio web no contiene un archivo físico, WordPress genera un archivo virtual robots.txt. Para habilitar el archivo virtual, primero debe anularlo siguiendo estos pasos: Abra su navegador y navegue hasta el directorio raíz de su sitio web.
Compruebe el archivo robots.txt.
Realice los cambios necesarios en el archivo.
Compruebe si ha guardado el archivo.
Su sitio web debe ser recargado.
El archivo robots.txt se puede actualizar yendo al menú 'Complementos' en la barra lateral izquierda y buscándolo. Realice cualquier cambio en el archivo robots.txt seleccionando 'Configuración' en el menú.