Copia de código fuente de una web con Httrack
Datos Generales
- Software: HTTRACK
- Dificultad: Fácil
- Duracion: 10 minutos
- Observaciones: Herramienta eficiente para la copia de páginas web, en caso de que la página contenga demasiada información no obtiene una información completa.
Descarga e instalación
Para equipos con SO Windows descargar el archivo ejecutable de https://www.httrack.com/ Para equipos con SO Linux/Ubuntu instalamos el paquete desde el repositorio apt
sudo apt update && sudo apt install httrack -y
En caso de que se pida instalar Las firmas siguientes porque la clave pública no está disponible de NO_PUBKEY 0E98404D386FA1D9 NO_PUBKEY 6ED0E7B82643E131 Utilizamos el siguiente comando para instalar las claves publicas
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 0E98404D386FA1D9 6ED0E7B82643E131
Y continuamos con la intalación normal
sudo apt install httrack -y
Copiando la web
Una vez instalado el paquete, descargamos la web completa utilizando el comando
httrack http://test.website.com -O./website_clone -F "Mozilla/5.0" r5 -%h -v
Donde:
- -F “Mozilla/5.0” Finge ser un navegador.
- -r5 Profundidad de descarga (ej: 5 niveles).
- %h Respeta la estructura de directorios del sitio.
Luego podemos utilizar nuestro editor de código preferido y realizar el análisis deseado.