html2text удобен для удобного просмотра HTML-файлов в CLI

4 min

language: ja bn en es hi pt ru zh-cn zh-tw

Здравствуйте, я неумеха.
Около года назад я проверял посты бывшего японского дилера по облигациям по следующей ссылке:
Молодой разум
Однако, поскольку этот человек, похоже, редактирует html файлы напрямую, и я не могу проверить прошлые статьи, я хотел бы сделать их более читабельными позже, так как я не успеваю регулярно их получать и читать. Читать html как есть в браузере — это нормально, но управлять им и просматривать с помощью cat неудобно.
Поэтому я подумал, есть ли что-то, что может преобразовать это в формат Markdown, который легко читать даже такому ленивому человеку, как я, и оказалось, что есть.

Установка html2text

sudo pacman -Sy artix-archlinux-support
sudo pacman -S html2text

Передача curl в html2text

Это делает его более читабельным.

curl "https://soulminingrig.com/" | html2text 

Для текстовых сайтов это может быть неплохим способом архивирования, но для изображений нужно правильно указывать пути, и эту обработку необходимо выполнять отдельно.

Преимущество просмотра в текстовом формате, прежде всего, в том, что легко использовать grep, а с Markdown также легко передать процесс преобразования в HTML в SSG и запустить локальный сайт для самостоятельной проверки.
Я не абсолютист Markdown, но и не ненавижу Markdown так сильно, как разработчики Scrapbox,
Языки разметки - Тосиюки Масуи

Одним из недавно популярных языков разметки является Markdown. Он был разработан для более краткого написания HTML и стал основным среди инженеров, поскольку является стандартом на GitHub и других платформах, но, честно говоря, он слишком сложен. Иногда я даже думаю, что было бы проще писать чистый HTML. Я бы хотел, чтобы он поскорее исчез, но проблема в том, что многие инженеры, которые лишь поверхностно знакомы с Markdown, ошибочно считают его «Markdown — это круто!». Нотация разметки Scrapbox была принята после того, как мы испытали все: Wiki, HTML, Scribe, TeX, roff и Markdown, поэтому мы были бы благодарны, если бы обсуждение велось с учетом этого. (Если есть лучшая и более крутая нотация, мы с радостью ее примем).

Я не особо придирчив к стилю написания, если он универсален и не вызывает затруднений, поэтому я пока погружен в Markdown.

Related Posts