html2text es útil para hacer que los archivos HTML sean legibles en la CLI

4 min

language: ja bn en es hi pt ru zh-cn zh-tw

Hola, soy un inútil.
Desde hace aproximadamente un año, he estado revisando las publicaciones de un exoperador de bonos japonés en el siguiente enlace:
Joven Sabiduría
Sin embargo, dado que esta persona parece estar editando directamente archivos html y no puedo consultar artículos anteriores, me gustaría hacer que los artículos que no pude seguir leyendo regularmente sean más fáciles de leer más tarde. Leer html tal cual desde un navegador está bien, pero es difícil de gestionar y de leer cuando se usa cat.
Así que pensé si habría algo que pudiera convertirlo a formato Markdown, legible incluso para una persona tan perezosa como yo, y funcionó.

Instalar html2text

sudo pacman -Sy artix-archlinux-support
sudo pacman -S html2text

Pasar curl a html2text

Esto lo hace más legible.

curl "https://soulminingrig.com/" | html2text 

Si se trata de un sitio basado en texto, esto podría ser una buena forma de archivarlo, pero las imágenes y demás necesitan rutas de acceso correctas, y ese procesamiento debe hacerse por separado.

Sobre todo, la ventaja de poder verlo en texto es que es fácil de usar grep, y con Markdown, también es fácil pasar el proceso de conversión a HTML a un SSG y configurar un sitio local para la verificación personal.
No soy un absolutista de Markdown, pero tampoco lo detesto tanto como los desarrolladores de Scrapbox.
Lenguajes de marcado - Toshiyuki Masui

Uno de los lenguajes de marcado populares recientemente es Markdown. Parece haber sido desarrollado para escribir HTML de forma más concisa, y como es estándar en GitHub y otros lugares, se ha vuelto muy conocido entre los ingenieros. Sin embargo, francamente, es demasiado problemático. Incluso a veces pienso que sería más fácil escribir HTML puro. Desearía que se extinguiera rápidamente, pero el problema es que muchos ingenieros que están a medias acostumbrados a Markdown lo malinterpretan, pensando "¡Markdown es lo mejor!". La notación de marcado de Scrapbox fue adoptada después de haber experimentado con Wiki, HTML, Scribe, TeX, roff, markdown y todos los demás, por lo que agradecería que las discusiones se llevaran a cabo teniendo esto en cuenta. (Si hay una notación mejor y superior, la adoptaría con gusto).

No tengo una preferencia particular por los estilos de escritura, siempre y cuando sea versátil y no sea problemático de escribir, así que por ahora, estoy inmerso en Markdown.

Related Posts