htmlq.md 749 B

htmlq

Utiliza selectores CSS para extraer contenido de archivos HTML. Más información: https://github.com/mgdm/htmlq.

  • Devuelve todos los elementos de la clase card:

cat {{ruta/al/archivo.html}} | htmlq '.card'

  • Obtiene el contenido del texto del primer párrafo:

cat {{ruta/al/archivo.html}} | htmlq --text 'p:primer-del-tipo'

  • Encuentra todos los enlaces de una página:

cat {{ruta/al/archivo.html}} | htmlq --attribute href 'a'

  • Elimina todas las imágenes y archivos SVG de una página:

cat {{ruta/al/archivo.html}} | htmlq --remove-nodes 'img' --remove-nodes 'svg'

  • Impresión bonita y escritura de la salida en un archivo:

htmlq --pretty --filename {{ruta/a/archivo.html}} --output {{ruta/a/salida.html}}