Obtener información de encabezado HTTP de sitios web usando curl

Anonim

La forma más sencilla de obtener información del encabezado HTTP de cualquier sitio web es mediante la herramienta de línea de comandos curl. La sintaxis para recuperar el encabezado de un sitio web es la siguiente:

curl -I url

Eso es una 'i' mayúscula, no una L minúscula, la i mayúscula extrae solo la información del encabezado .

Pruébelo usted mismo con una URL de muestra, aquí hay una cadena de sintaxis de ejemplo usando Google.com como encabezado del sitio web para recuperar:

curl -I www.google.com

De nuevo, es importante tener en cuenta que la I en mayúscula si solo desea el encabezado del sitio. Usando minúsculas, le daré una tonelada de HTML minimizado junto con el encabezado, simplemente desplácese hacia arriba en la ventana de la terminal hasta las líneas que siguen directamente al comando curl para encontrar la información del encabezado HTTP.

Un ejemplo de los detalles del encabezado HTTP recuperados por curl. Podría tener este aspecto:

Una manera fácil de evitar todas las tonterías de HTML, Javascript y CSS es usar el indicador -D para descargar el encabezado en un archivo separado y luego abrir ese archivo en su editor de texto preferido :

curl -iD httpheader.txt www.apple.com && open httpheader.txt

Este es el mismo comando curl que antes con algunos modificadores. El uso del ampersand doble le dice al comando que solo abra el archivo si el encabezado se descargó correctamente.El uso de 'abrir' abrirá httpheader.txt en el editor de texto GUI predeterminado, que generalmente es Text Edit, pero puede usar vi, nano o cualquiera de sus herramientas de línea de comandos preferidas:

curl -iD httpheader.txt www.apple.com && vi httpheader.txt

curl es una poderosa utilidad con la que vale la pena familiarizarse. Cualquier persona involucrada en la web debería aprovechar el truco del encabezado, y los desarrolladores web también pueden usar curl para copiar todo el HTML y CSS de un sitio web muy rápidamente. La otra ventaja de curl es que está ampliamente disponible para prácticamente todos los sistemas operativos, se incluye con casi todas las versiones de Mac OS X y Linux, y también puede encontrar versiones para Windows e incluso Android e iOS a través de aplicaciones individualizadas. Debido a que curl tiene una larga historia y los comandos son universales en todas las plataformas, es realmente la opción ideal para extraer detalles del encabezado y es una herramienta valiosa para administradores de sistemas, administradores de redes, desarrolladores web y muchas otras profesiones técnicas.

Actualización: Banderas actualizadas de -i a -I por recomendación del lector, ¡gracias a todos!

Obtener información de encabezado HTTP de sitios web usando curl