Esta guía te enseña cómo utilizar el comando wget en Linux. Proporciona 12 ejemplos de comandos wget en acción para ayudarte a utilizarlos. Una vez que hayas terminado, conocerás todo sobre wget y cómo usarlo para obtener archivos de la web.
¿Qué es el Comando Wget?
Wget es una herramienta informática creada por el Proyecto GNU. Puedes utilizarla para recuperar contenido y archivos de varios servidores web. El nombre es una combinación d
e World Wide Web y la palabra get. Admite descargas a través de FTP, SFTP, HTTP y HTTPS.
Wget está creado en C portable y es utilizable en cualquier sistema Unix. También es posible implementarlo en Mac OS X, Microsoft Windows, AmigaOS y otras plataformas populares.
¿Cómo Instalar Wget?
Para esta demostración del comando wget, utilizaremos Ubuntu 16.04. Pero la sintaxis funcionará en cualquier otra distribución de Linux.
Primero, accede a tu servidor a través de SSH:
```bash
ssh usuario@tu_ip_del_servidor -p puerto
```
Para instalar wget en Ubuntu 18.04 o similar, ejecuta el siguiente comando:
```bash
sudo apt-get install wget
```
Para instalar wget en CentOS 7 o distribuciones anteriores, usa:
```bash
sudo yum install wget
```
Una vez que la instalación haya terminado, estarás listo para usarlo. Además, el conocimiento de comandos básicos de SSH puede facilitar las cosas.
Ejemplos de Comandos Wget:
Para comenzar, proporcionaremos 12 ejemplos de comandos wget que puedes usar para tareas diarias. ¡Ten en cuenta que también puedes llamar a esta función desde scripts y trabajos cron!
1. Utilizando Wget para Descargar Archivos Individuales:
Uno de los ejemplos básicos de comando wget es descargar un solo archivo y almacenarlo en tu directorio de trabajo actual. Por ejemplo, puedes obtener la última versión de WordPress con el siguiente comando:
```bash
```
En este ejemplo, se descargará un archivo llamado latest.zip en el directorio de trabajo actual. También verás información adicional, como el progreso de la descarga, la velocidad, el tamaño, la hora y la fecha.
2. Utilizando Wget para Descargar Múltiples Archivos:
Podemos llevar el uso de wget un paso más allá y descargar varios archivos a la vez. Para hacer eso, necesitaremos crear un documento de texto y colocar las URL de descarga allí.
Por ejemplo, recuperaremos las últimas versiones de WordPress, Joomla y Drupal con wget. Ingresa lo siguiente:
```bash
nano ejemplo.txt
```
Esto creará un archivo ejemplo.txt y abrirá una interfaz de editor de texto. Pega estos enlaces allí:
```
```
Una vez hecho, puedes usar -i para obtener todos los archivos almacenados en tu archivo de texto de ejemplo:
```bash
wget -i ejemplo.txt
```
Espera a que el proceso termine y tendrás las instalaciones de tres de los sistemas de gestión de contenido más populares.
3. Utilizando Wget para Obtener Archivos con Nombres Diferentes:
En este ejemplo de wget, guardaremos un archivo con un nombre diferente con la ayuda de la opción -O:
```bash
```
En este caso, el recurso descargado se guardará como wordpress-install.zip en lugar de su nombre original.
4. Utilizando Wget para Guardar Archivos en un Directorio Especificado:
Puedes utilizar wget para colocar un archivo en otro directorio usando la función -P:
```bash
wget -P documentos/archivos/ https://wordpress.org/latest.zip
```
El archivo que recuperes con esta sintaxis aparecerá en la carpeta documentos/archivos/.
5. Utilizando Wget para Limitar la Velocidad de Descarga:
Con wget, también puedes limitar la velocidad de descarga. Esto es útil al recuperar archivos grandes y evitará que use todo tu ancho de banda. Este ejemplo de wget establecerá el límite en 500k:
```bash
wget --limit-rate=500k https://wordpress.org/latest.zip
```
6. Utilizando Wget para Configurar Intentos de Reintento:
Problemas de conexión a Internet pueden interrumpir tu descarga. Para abordar este problema, podemos aumentar los intentos de reintento usando la función -tries:
```bash
wget --tries=100 https://wordpress.org/latest.zip
```
7. Utilizando Wget para Descargar en Segundo Plano:
Para archivos extremadamente grandes, puedes aprovechar la función -b. Descargará tu contenido en segundo plano.
```bash
```
Aparecerá un archivo wget-log en tu directorio de trabajo, que se puede utilizar para verificar el progreso y el estado de tu descarga. También puedes usar el comando tail:
```bash
tail -f wget-log
```
8. Utilizando Wget para Descargar a través de FTP:
El comando también es utilizable con FTP. Solo necesitarás especificar el nombre de usuario y la contraseña, como en este ejemplo de wget:
```bash
wget --ftp-user=TU_NOMBRE_DE_USUARIO --ftp-password=TU_CONTRASEÑA ftp://ejemplo.com/algo.tar
```
9. Utilizando Wget para Continuar Descargas Interrumpidas:
Tu descarga puede interrumpirse si pierdes la conexión a Internet o experimentas un corte de energía. Esto es bastante común al descargar archivos grandes. En lugar de comenzar de nuevo, es posible continuar la descarga utilizando la función -c:
```bash
```
Si procedes sin la función -c, el nuevo archivo tendrá .1 agregado al final, ya que ya existe.
10. Utilizando Wget para Recuperar Sitios Web Completos:
También es posible utilizar el comando wget para descargar el contenido de un sitio web completo. Esto te permitirá verlo localmente sin una conexión a Internet. Aquí tienes un ejemplo:
```bash
wget --mirror --convert-links --page-requisites --no-parent -P documentos/sitios-web/ https://algun-sitio.com
```
Analizaremos los ingredientes de este comando wget:
- --mirror: Hace que tu descarga
sea recursiva.
- --convert-links: Todos los enlaces se convertirán para un uso adecuado sin conexión.
- --page-requisites: Lo siguiente incluirá todos los archivos necesarios, como CSS, JS e imágenes.
- --no-parent: Asegura que no se recuperen directorios por encima de la jerarquía.
- -P documentos/sitios-web/: Asegura que todo el contenido vaya a nuestro directorio especificado.
Una vez que el proceso termine, podrás abrir el sitio web descargado localmente y encontrar todos los archivos en la carpeta documentos/sitios-web/.
11. Utilizando Wget para Localizar Enlaces Rotos:
Intentemos algo más avanzado. Podemos usar el comando wget para localizar todos los URLs rotos que muestren el error 404 en un sitio web específico. Comienza ejecutando lo siguiente:
```bash
wget -o wget-log -r -l 5 --spider http://ejemplo.com
```
- -o: Recopila la salida en un archivo para usarla más tarde.
- -l: Especifica el nivel de recursión.
- -r: Hace que la descarga sea recursiva.
- --spider: Configura wget en modo araña.
Ahora podemos investigar el archivo wget-log para encontrar la lista de enlaces rotos. Aquí tienes el comando para hacerlo:
```bash
grep -B 2 '404' wget-log | grep "http" | cut -d " " -f 4 | sort -u
```
12. Utilizando Wget para Descargar Archivos Numerados:
Si tienes archivos o imágenes numeradas en una lista específica, puedes descargar fácilmente todos ellos con la siguiente sintaxis:
```bash
```
Conclusión:
¡Felicidades! Al completar este tutorial, has aprendido varios usos del comando wget. Ahora puedes utilizarlo para obtener archivos individuales o múltiples. Además, has aprendido algunos usos avanzados, como descargar un sitio web completo o localizar URL rotos. Para obtener más información, también puedes consultar la documentación oficial.
¿Hay algún consejo o truco oculto que quieras compartir? ¡Siéntete libre de hacerlo en los comentarios!