html2text удобен для удобного просмотра HTML-файлов в CLI
Здравствуйте, я неумеха.
Около года назад я проверял посты бывшего японского дилера по облигациям по следующей ссылке:
Молодой разум
Однако, поскольку этот человек, похоже, редактирует html файлы напрямую, и я не могу проверить прошлые статьи, я хотел бы сделать их более читабельными позже, так как я не успеваю регулярно их получать и читать. Читать html как есть в браузере — это нормально, но управлять им и просматривать с помощью cat неудобно.
Поэтому я подумал, есть ли что-то, что может преобразовать это в формат Markdown, который легко читать даже такому ленивому человеку, как я, и оказалось, что есть.
Установка html2text
sudo pacman -Sy artix-archlinux-support
sudo pacman -S html2text
Передача curl в html2text
Это делает его более читабельным.
curl "https://soulminingrig.com/" | html2text
Для текстовых сайтов это может быть неплохим способом архивирования, но для изображений нужно правильно указывать пути, и эту обработку необходимо выполнять отдельно.
Преимущество просмотра в текстовом формате, прежде всего, в том, что легко использовать grep, а с Markdown также легко передать процесс преобразования в HTML в SSG и запустить локальный сайт для самостоятельной проверки.
Я не абсолютист Markdown, но и не ненавижу Markdown так сильно, как разработчики Scrapbox,
Языки разметки - Тосиюки Масуи
Одним из недавно популярных языков разметки является Markdown. Он был разработан для более краткого написания HTML и стал основным среди инженеров, поскольку является стандартом на GitHub и других платформах, но, честно говоря, он слишком сложен. Иногда я даже думаю, что было бы проще писать чистый HTML. Я бы хотел, чтобы он поскорее исчез, но проблема в том, что многие инженеры, которые лишь поверхностно знакомы с Markdown, ошибочно считают его «Markdown — это круто!». Нотация разметки Scrapbox была принята после того, как мы испытали все: Wiki, HTML, Scribe, TeX, roff и Markdown, поэтому мы были бы благодарны, если бы обсуждение велось с учетом этого. (Если есть лучшая и более крутая нотация, мы с радостью ее примем).
Я не особо придирчив к стилю написания, если он универсален и не вызывает затруднений, поэтому я пока погружен в Markdown.