Si ejecuto un script de Python que descarga todos los datos de una página en particular en Quora (*), ¿dejará Quora ejecutar mi script o lo etiquetará como actividad sospechosa?

Si echa un vistazo a la política de rastreadores de quora http://www.quora.com/robots.txt,
Para los bots registrados, no están prohibiendo preguntas y respuestas.

Googlebot por ejemplo:

Agente de usuario: Googlebot

No permitir: / log /
No permitir: / ajax /
No permitir: / * / log
No permitir: / * / rss
No permitir: / * / preguntas_rss
No permitir: / * / answers_rss
No permitir: / * _ POST
No permitir: / home / global_feed
No permitir: / buscar
No permitir: / digerir /
No permitir: / email_optout /

Por lo tanto, un bot ético idealmente debería registrarse con ellos antes de realizar cualquier tipo de rastreo. Para los bots no registrados, la lista de permisos es bastante pequeña con la que no se puede hacer mucho.

Además, mirando su archivo robots.txt, puede registrarse fácilmente enviando un correo electrónico a [correo electrónico protegido]

Dicho todo esto, se supone que todos los rastreadores éticos deben seguir el archivo robots.txt de un sitio web. No estoy realmente seguro de si quora está haciendo cosas como etiquetar actividades sospechosas o prohibir tales bots. Esto es algo que una persona que trabaja en quora debe informarnos.

Puede enviar solicitudes y descargar datos … Si considera hacerlo a intervalos regulares o desea automatizar, pueden bloquear su IP o cualquier cosa para cancelar su solicitud. Pero esto es raro. Dado que en algún momento sus herramientas de monitoreo notificarán sobre el rastreo web automatizado desde cierto rango de IP. Esta no es exactamente la respuesta sobre quora, es para cualquier sitio web rico en estadísticas y contenido.
Ejemplo: ESPN cricinfo, Quora, etc.