html2text é útil para tornar arquivos HTML legíveis na CLI

4 min

language: ja bn en es hi pt ru zh-cn zh-tw

Olá, sou um incompetente.
Há cerca de um ano, tenho verificado as postagens de um ex-negociador de títulos japoneses em:
Jovem Conhecimento
No entanto, como essa pessoa parece editar arquivos html diretamente, não consigo verificar artigos anteriores, etc. Eu gostaria de tornar mais fácil ler posteriormente o que não consegui acompanhar, obtendo-o regularmente. Ler html diretamente no navegador é bom, mas é difícil de gerenciar e visualizar quando se usa cat.
Então, pensei se haveria algo que pudesse converter para o formato Markdown, que é fácil de ler até para uma pessoa preguiçosa como eu, e funcionou.

Instalar html2text

sudo pacman -Sy artix-archlinux-support
sudo pacman -S html2text

Passar curl para html2text

Isso o torna mais legível.

curl "https://soulminingrig.com/" | html2text 

Para sites baseados em texto, isso pode ser uma boa forma de arquivar, mas é preciso especificar os caminhos das imagens corretamente, e esse processamento precisa ser feito separadamente.

Acima de tudo, a vantagem de poder visualizar em formato de texto é que facilita o uso de grep, e com Markdown, é fácil passar o processamento de conversão para HTML para um SSG e configurar um site para verificação local.
Não sou um absolutista de Markdown, mas também não odeio Markdown tanto quanto os desenvolvedores do Scrapbox.
Linguagens de Marcação - Toshiyuki Masui

Uma das linguagens de marcação populares recentemente é o Markdown. Parece ter sido desenvolvido para escrever HTML de forma mais concisa e tornou-se padrão em lugares como o GitHub, sendo popular entre os engenheiros. No entanto, para ser franco, é muito problemático. Às vezes, penso que seria mais fácil escrever HTML puro. Gostaria que ele desaparecesse rapidamente, mas o problema é que muitos engenheiros que se acostumaram com o Markdown de forma superficial o interpretam mal, pensando 'Markdown é o máximo!'. A notação de marcação do Scrapbox foi adotada após experimentar Wiki, HTML, Scribe, TeX, roff, markdown e outros, então eu apreciaria se a discussão levasse isso em consideração. (Se houver uma notação ainda melhor, ficaria feliz em adotá-la).

Eu não tenho uma preferência particular por estilos de escrita, desde que seja versátil e não seja complicado de escrever, então estou imerso em Markdown por enquanto.

Related Posts