使用 HTTRACK 完整保存網站的方法【我來協助您保存】

2 min

language: ja bn en es hi pt ru zh-cn zh-tw

httrack.png

你好,我是無能。

作為前言,我寫下了我保存的原因,對於無法進行網路爬取的人,我將代為執行,因此如果您能在此文章留言,我將不勝感激。由於是審核制,如果您不想留下評論,可以在註明後透過電子郵件發送。※根據規模和限制,可能無法執行。

在一切都逐漸消失的情況下,歸檔服務雖然很方便,但其顧慮點我想有以下兩點。

歸檔服務的顧慮點

-營運方終止服務所造成的損失
-需要網路連線

關於第一點,最近,The-Eye.eu實際上終止了服務,此外,我感覺隨著AI的普及,為了阻止自動學習,網路爬取本身正朝著被限制的方向發展。
另外,題外話,我認為The-Eye.eu的營運方很可能與2000年前後網路初期建立藝術網站的Eye 4 You成員有關。

回到正題,關於第二點,鑑於網路正逐漸走向不得不產生封閉空間的局面,我也覺得目前有必要在本地環境中儲存資料。尤其讓我感受到的是,雖然不能在這裡公開,最近維基百科敗訴並被迫修改,這也逐漸讓網路失去了自由。

現階段保存網站的理由

或許,我現在的年齡是20歲出頭,可以說是年輕,但讓我們想想2000年前後,那些支持網路初期的人現在幾歲了。

從PC歷史主要開始普及的1980年代起,假設當時的人20歲,到2000年就將近40歲。
而那些支持早期PC和網路的人,現在已經將近60歲了。網站的維護就像房屋一樣,需要人們活著去維護和使用才能得以保存。
然而,那些人也是凡人,如果他們處於無法維護的境地,那也是無可奈何的事。

遺憾的是,這些資訊的媒介是數位化的,因此只會逐漸消失。我們所學到的都是從過去的經驗中汲取教訓,我認為將寶貴的資訊作為娛樂或了解過去的事物保留下來,也是對當時人們的一種敬意。

特別是,最近是所謂的加速社會,串流服務成為主流,我感覺資訊被稀釋了,因此我決定保存以文字為主體的網站。
至於影片,我對其作為資料的持久性和可用性感到疑問,因此如果是重要資訊,我認為保存以文字整理的網站會更有效率。

HTTRACK 的使用方法

那麼,這次的介紹是以使用 GNU/Linux 為前提。

在我的環境中,由於使用 Devuan,套件管理使用 apt。

apt install httrack

安裝完成了嗎?

那麼,接下來只需輸入這個。

httrack "保存したいサイトのURL" -O "保存先ディレクトリ" "+*.gif" "+*.jpg" "+*.png" 

-O : 指定儲存目錄

最穩定地保存下來的是上述方法。

HTTrack 還有其他幾種方便的保存方法,我也還有很多需要學習的地方。
HTTrack 官方網站


那麼。
再次請多關照。

Related Posts