html2text

Sitio web

  • Libre
  • Mac
  • Windows
  • Linux
Description

html2text es una utilidad de línea de comandos, escrita en C ++, que convierte documentos HTML en texto sin formato.

Cada documento HTML se carga desde una ubicación indicada por un URI o se lee desde una entrada estándar, y se formatea en un flujo de caracteres de texto sin formato que se escribe en la salida estándar o en un archivo de salida. El URI de entrada puede especificar un sitio remoto, desde el cual los documentos se cargan a través del Protocolo de transferencia de hipertexto (HTTP).

El programa puede preservar las posiciones originales de los campos de la tabla, le permite configurar el ancho de la pantalla (para un número dado de caracteres de salida) y acepta también la entrada sintácticamente incorrecta (intentando para interpretarlo "razonablemente"). El texto en negrita y subrayado se representa de forma predeterminada con secuencias de retroceso (lo que es particularmente útil cuando se canaliza la salida del programa a "menos" u otro paginador). Todas las propiedades de representación se pueden personalizar en gran medida a través de un archivo RC.

Categorías
Aplicaciones y software de desarrollo

Alternativas