Clase RobotFileParser
La clase RobotFileParser proporciona varios métodos para leer, analizar y responder preguntas sobre los robots.archivo txt en un recurso dado.
Los métodos compatibles incluyen:
Caso de uso de ejemplo
El siguiente código muestra el uso de la clase RobotFileParser y los métodos proporcionados.
importar urllib.robotparser
rp = urllib.robotparser.RobotFileParser ()
RP.set_url ("https: // linuxhint.com/robots.TXT")
RP.leer()
req_rate = rp.request_rate ("*")
req_rate.segundos
RP.Crawl_delay ("*")
RP.can_fetch ("*", "https: // linuxhint.com/suscríbete a linuxhint-com/")
RP.can_fetch ("*", "https: // linuxhint.com/suscríbete a linuxhint-com/wp-admin ")
El código anterior comienza importando el módulo RobotParser y creando una instancia de la clase RobotFileParser.
Luego pasamos la URL a los robots.archivo txt y enviar el archivo al analizador. Luego usamos los métodos proporcionados para realizar diversas acciones.
El código anterior debería devolver:
5
30
Verdadero
FALSO
Conclusión
En este artículo, discutimos cómo usar el módulo RobotParser del paquete Urllib que le permite realizar varias acciones según lo dispuesto en los robots.archivo txt. Siéntase libre de explorar el código fuente para obtener más información.