使用 html2text 讓 CLI 中的 html 文件更易讀
您好,我是無能。
大約一年前,我開始在以下連結查看前日本債券交易員的貼文:
年輕的智慧
然而,這位作者似乎直接編輯html文件,導致我無法查看過去的文章。我想定期獲取並閱讀這些內容,以便稍後更容易閱讀那些來不及看的文章。但直接從瀏覽器閱讀html文件還可以,但在管理時,例如使用cat命令查看時,會很不方便。
所以我想,有沒有什麼工具可以將其轉換成連我這種墮落的人也能輕鬆閱讀的Markdown格式呢?結果還真有。
安裝 html2text
sudo pacman -Sy artix-archlinux-support
sudo pacman -S html2text
將 curl 傳遞給 html2text
這樣就更容易閱讀了。
curl "https://soulminingrig.com/" | html2text
如果是基於文字的網站,這樣歸檔可能還不錯,但圖片等內容需要正確指定路徑,這部分需要另外處理。
最重要的是,以文字形式查看的好處是更容易使用grep,而且如果是Markdown格式,可以將HTML轉換處理傳遞給SSG,輕鬆建立一個用於本地自我檢查的網站。
我絕不是Markdown的絕對主義者,但也不像Scrapbox開發者那樣討厭Markdown,所以
標記語言 - 增井俊之
最近流行的一種標記語言是Markdown。它似乎是為了更簡潔地編寫HTML而開發的,並且在GitHub等平台上成為標準,因此在工程師中很受歡迎,但坦白說,它太麻煩了。我甚至覺得直接編寫原始HTML會更輕鬆。我希望它趕快滅絕,但令人困擾的是,許多對Markdown半生不熟的工程師誤以為「Markdown最棒了!」Scrapbox的標記語法是在體驗過Wiki、HTML、Scribe、TeX、roff和markdown等所有這些之後才採用的,因此如果能基於這些點進行討論,我將不勝感激。(如果有更好的、最棒的語法,我們樂意採用)
我個人對寫作方式沒有特別的堅持,只要它具有通用性且編寫起來不麻煩,所以我暫時沉浸在Markdown中。